Stanford Shift-Reduce Parserの精度の再現

Stanford ParserはBerkeley Parserと並んで有名なParserの一つ。以前はPCFGのparserだけだったが、最近はShift-Reduceに基づいたものも出ている。

beam searchを使うとPCFGを使ったものよりちょっ早でかつ精度も出るということでよい感じである(ただし、k-bestなどはまだちゃんと返してくれない。ToDoになっていた)。モデルファイルはStanfordが準備してくれているが、思ったよりも精度が出ない。何か秘伝のオプションがあるのだろうと思うので、まずWSJで精度が再現できるかを確かめてみることにした。再現スクリプトは探してみると以下のところにあった。shellじゃなくてmakefileに書いてあった。

秘伝のオプションを付けたら精度が再現できるようになったので、OK。