キーフレーズ抽出をつけた

彼> この会話で何が起きて欲しいですか?
僕> キーワード抽出ではなくキーフレーズ抽出に変えたのでその動作確認をしたい
彼> あなたはそのキーフレーズ抽出をどう知るのですか?
僕> 今までは形態素解析して名詞を取り出してIDFで重み付けしてたんだけど、このバージョンでは名詞が連続している場合は結合することにした
彼> あなたが価値を感じているのは何ですか?
僕> キーフレーズ抽出だね
彼> 形態素解析について、他に何かありますか?
僕> 今回はKyTeaを使ってるんだけど、例えば「リトマス試験紙」は「紙」だけ接尾辞扱いになったりする。なので名詞直後の接尾辞は名詞の一部として結合するコードを書いた。
彼> その名詞直後は、何のようですか?
僕> ああー、それをくっつけちゃうか…
彼> KyTeaは、何のようですか?
僕> MeCabはツール感があったけど、KyTeaは部分アノテーションで育てていく感じが生き物っぽい
彼> キーワード抽出は、何のようですか?
僕> 最初のプロトタイプとしてはまあ悪くなく動いたけど、使っているうちにそれでは全然十分でないことがわかった。
彼> キーフレーズ抽出は、どのあたりにありますか?
僕> 人間からの入力を受け取ると即座にキーフレーズ抽出に回している。いや、正確にはNGでプレフィックスしている場合は別経路だけど。
彼> あなたが価値を感じているのは何ですか?
僕> KyTeaとキーフレーズ抽出とこのプログラムが改善されること
(プログラムがクラッシュしました)