漢字仮名交じり文の読み仮名抽出(メモ編)

ちょっと思いついたので、メモです。

  1. Mac標準搭載のmecab
  2. CFStringTokenizer
    • 分かち書きされた各形態素をローマ字表記へ変換する
      • 品詞情報を用いて表記と読みが違うもの(『は』『へ』等)は読み用表記(『わ』『え』)にする
    • CFStringTransformでひらがな化

これで、何もインストールせずに読みかな抽出ができるかも?


ん〜
Mac標準搭載のmecabで、featureを見ると品詞情報しかない。。。
dicrcをいじれば読みをとれるのだろうか・・・
それとも、そもそもデータ入ってないのだろうか・・・
よくわかりません