この記事は(検証可能)な(参考文献や出典)が全く示されていないか、不十分です。(2018年2月) |
テキストマイニング(英: text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である[1]。
テキストデータの多くは形式が定まっておらず、また日本語は英語などと比べて単語の境界判別の必要性(→わかち書き)や文法ゆらぎが大きい点において形態素解析が困難であったが、自然言語処理の発展により実用的な水準の分析が可能となった。テキストマイニングの対象としては、顧客からのアンケートの回答やコールセンターに寄せられる質問や意見、電子掲示板やメーリングリストに蓄積されたテキストデータなどがある[2]。
テキストマイニングの効果
テキストマイニングは、言葉的にはデータマイニングと似ているが、その効果は異なる。データマイニングが顧客個人の購買傾向を分析するなどの目的で行われるのに対し、テキストマイニングは顧客個人の特性よりも提供側の状態を把握する面において威力を発揮する。例えば商品の評価や顧客サービスの問題点などを把握することができる[3]。
ソフトウェアの例
関連項目
脚注
外部リンク
- テキストマイニングとは 【text mining】 - 意味/解説/説明/定義 : IT用語辞典
- テキストマイニング - @IT情報マネジメント用語事典
- 日本大百科全書(ニッポニカ)『(テキストマイニング)』 - コトバンク