IBMモデル1を実装した

学習後の変換確率:

入力データはこんな感じ

raw_data = """
das Haus ist klein
the house is small
das Haus ist schmutzig
the house is dirty
das Haus ist sauber
the house is clean
Ich habe einen Stift
I have a pen
Ich liebe dich
I love you
eine kleine Nacht musik
a little night music
"""

学習後の翻訳結果がこちら

das Haus ist klein
house house house small
das Haus ist schmutzig
house house house dirty
das Haus ist sauber
house house house clean
Ich habe einen Stift
I have have have
Ich liebe dich
I love love
eine kleine Nacht musik
little little little little 

うーん。ひどい。まあでもこれは原始的なIBMモデル1だし、言語モデルもまだ入ってないし、データの量もすごく少ないからなぁ。今後改良して行ってどう変化するのかが見ものかなぁ。