2011-12-18 漢字仮名交じり文の読み仮名抽出(メモ編) 読み仮名抽出 ちょっと思いついたので、メモです。 Mac標準搭載のmecab 分かち書き 形態素の品詞情報取得 CFStringTokenizer 分かち書きされた各形態素をローマ字表記へ変換する 品詞情報を用いて表記と読みが違うもの(『は』『へ』等)は読み用表記(『わ』『え』)にする CFStringTransformでひらがな化 これで、何もインストールせずに読みかな抽出ができるかも? ん〜 Mac標準搭載のmecabで、featureを見ると品詞情報しかない。。。 dicrcをいじれば読みをとれるのだろうか・・・ それとも、そもそもデータ入ってないのだろうか・・・ よくわかりません