IBMモデル1を実装した
入力データはこんな感じ
raw_data = """ das Haus ist klein the house is small das Haus ist schmutzig the house is dirty das Haus ist sauber the house is clean Ich habe einen Stift I have a pen Ich liebe dich I love you eine kleine Nacht musik a little night music """
学習後の翻訳結果がこちら
das Haus ist klein house house house small das Haus ist schmutzig house house house dirty das Haus ist sauber house house house clean Ich habe einen Stift I have have have Ich liebe dich I love love eine kleine Nacht musik little little little little
うーん。ひどい。まあでもこれは原始的なIBMモデル1だし、言語モデルもまだ入ってないし、データの量もすごく少ないからなぁ。今後改良して行ってどう変化するのかが見ものかなぁ。