自分用メモ

現実逃避。mecab-ipadic-2.7.0-20070801/char.defとかを見つつ。16進数とかで漢字の範囲がどこからどこまでというような内容のが入っている。この辺詳しくないので、Rubyで確認。

(0x2E80..0x2EF3).each{|c|puts [c].pack("U")}

この辺を頑張れば、文字種を高速に判定できて、素性作るときとかに便利そう。ただし面倒くさそう。。。