|
早稲田大学
山名 早人
教授
機関別共同研究
Discovery Saga
論文分野別Discovery Saga
研究テーマDiscovery Saga
協賛企業
共同研究先:National Institute of Infomatices
Academic
共同研究数 1
Conference Paper
2006
IEEE : Institute of Electrical and Electronics Engineers
Text Mining using PrefixSpan constrained by Item Interval and Item Attribute
(Last author)
項目間隔と項目属性で制約されたPrefixSpanを用いたテキストマイニング
Issei Sato, Yu Hirate, Hayato Yamana
【抄録】
Applying conventional sequential pattern mining methods to text data extracts many uninteresting patterns, which increases the time to interpret the extracted patterns. To solve this problem, we propose a new sequential pattern mining algorithm by adopting the following two constraints. One is to select sequences with regard to item intervals-The number of items between any two adjacent items in a sequence-And the other is to select sequences with regard to item attributes. Using Amazon customer reviews in the book category, we have confirmed that our method is able to extract patterns faster than the conventional method, and is better able to exclude uninteresting patterns while retaining the patterns of interest. © 2006 IEEE.
【抄録日本語訳】
従来の逐次パターンマイニング手法をテキストデータに適用すると、興味のないパターンが多く抽出され、抽出されたパターンを解釈する時間が長くなってしまう。この問題を解決するために、我々は以下の2つの制約を採用した新しい逐次パターン採掘アルゴリズムを提案する。一つは、項目間隔(配列中の隣接する二つの項目の間の項目数)に関して配列を選択することであり、もう一つは、項目属性に関して配列を選択することである。Amazonの書籍カテゴリのカスタマーレビューを用いて、本手法が従来手法よりも高速にパターンを抽出でき、関心のあるパターンを残したまま関心のないパターンを排除できることを確認した。© 2006 IEEE.