Rubyとマルチバイト文字列

Ruby1.9に乗り変えようとしたら、案の定マルチバイト文字列の付近ではまっているのでメモ。初めてのRubyとか見つつ。

文字列は単なるバイト列ではなく、真の意味での「文字の列」
Stringオブジェクトは自身のエンコーディングを知っている
- lengthもそれを考慮した文字の数を返す
エンコーディングに関わってくるのは、入力、出力、内部表現
マジックコメント(Shebangとか)でソースコードがどの方式でエンコードされているかを判定
String#encodeメソッドで文字列を可能ならコード変換することができる
- 失敗した場合はArgumentError例外が発生
force_endodingメソッドはバイト列表現は変化させず、エンコーディング情報だけを変更する
- 「実用上はむやみなforce_encodingは控えるべきで、encodeが適切なケースが多い」と書いてあった
  - Don't use String#force_encoding - 世界線航跡蔵の付近か
エンコーディングが違う文字列同士は結合することができない
文字列は、バイト表現が同値かつエンコーディングも同じ場合に限り同値