2012-01-01から1ヶ月間の記事一覧

Pythonでサロゲートペアの範囲の数値実体参照を文字に戻す

𠮟 (𠮟)が数値実体参照で表現されているのをPythonのUnicode文字に戻すのにどうするの?という質問について。普通にunichr(134047)したら以下のような例外が飛ぶ。 ValueError: unichr() arg not in range(0x10000) (narrow Python build)(narrow Pyt…

他の言語に慣れた人がRubyを使ったときにつまずきがちな9つのポイント

他の言語に慣れた人がPythonを使ったときにつまずきがちな9つのポイントの続編。ささださんも書いています see: だいありー 0は真, 空文字列も真 C言語などと違って、0は偽ではない。PythonやJavaScript, PHPと違って空文字列も偽ではない。 >if 0 then prin…

他の言語に慣れた人がPythonを使ったときにつまずきがちな10のポイント

今日質問されて、以前Twitterで書いたのを思い出して、そして検索性が悪くて見つけ出すのに苦労した。こちらに転載しておく。詳細は気が向いたときに埋める。 オプション引数の評価タイミング Rubyではオプション引数は関数が呼ばれるたびに評価される。 def…

ブタのスカモルツァを食べた話

チーズ専門店HISADA チーズ通販/商品詳細 スカモルツァ マイアリーノ豚 SCAMORZA MAIALINO 1P(約100g) Scamorza - Wikipedia, the free encyclopediaワックスで包まれている。って茶色い方は僕がいじりすぎて剥がれちゃったんだけど。ワックスをはがすとこん…

GTDマインドマップ ver3

GTDレバレッジメモasマインドマップ、GTDレバレッジメモasマインドマップ その2の続編。昨年10月に作ったver.2を描き直したくなったのでTwitterでブツブツつぶやきながら2ポモドーロほど作業をして新しいバージョンを作った話。以下Twitterからの転載。以前G…

Pythonの例外を記録してみる

よくあるエラー が意外と参照されている。で、ふと「例外のフックを使って起こった例外を全部記録しておいて、たくさん溜まってから集計したら面白いんじゃないか」と思った。というわけでsite.pyに下のように書きたしてみた。 def setup_exc_hook(): "recor…

gitにでかいバイナリファイルを入れるとどうなるか

ふと気になったのでgitにでかいバイナリファイルを入れたらどうなるのか調べてみた。自分の発表が録画された112メガのaviファイルを実験対象に使う。 cp まずはgitを使わない普通のcpの時間を測っておく。 real 0m0.744s user 0m0.001s sys 0m0.179s git add…

Pythonのpickle.dumpに3番目の引数がある話

cPickle.dump(obj, f, -1)みたいな使い方を見て、なんだこの-1?と思ったので調べてみた。簡潔に言えば、これはフォーマットの指定で、指定しなかったときは後方互換性のために初期のASCII形式での保存がおこなわれる。-1ってのは最新のを使えという意味で、…

解説用の図

「値渡しか参照渡しか」という二分論は混乱の元

先日のプログラミングシンポジウムでは「今の時代となってはむしろ有害な教育って何だろう」という話題が出た。その時には思いつかなかったけども、今日「Pythonはすべてが参照だっていうけど、boolとか参照渡しじゃないよね」という趣旨の発言を見て思いつ…

Google NGram Viewerでマッシュアップという概念の普及した時期を調べた

下のグラフはmashup, JSON, XHRでの検索結果。 下のグラフはAjaxの検索結果。 というわけでこれらのキーワードへの言及は2005〜2006年に急激に増えているってことがわかった。JSONは2001年頃できて、2005年頃Yahoo、ついでGoogleがAPIの提供を開始した。 htt…

cp932で表現できない文字がたまに混ざるユニコード文字列をWindowsのコンソールにprintしたい場合

こんな質問を受けました Windows上のPython2.7を使っていて、手軽なデバッグ出力にprint文を使っているのだが、表示しようとしたユニコード文字列xにcp932で表現できない文字が含まれているとUnicodeEncodeErrorになってしまう。明示的にx.encode('cp932', '…

講義資料「テストとデバッグ」を公開しました

昨年行われたセキュリティ&プログラミングキャンプ2011で中学生〜大学生を対象として行った講義「テストとデバッグ」の発表資料を公開します。 テストとデバッグ View more presentations from nishio

コードリーディング観察日記

以前コードリーディングの方法を聞かれて「僕、全然読めないよ」と答えたんだけど、そういう解釈はさておき客観的事実としては30分の空き時間で「Pythonクラスのメソッド名解決順序」に書いてあるようなことを調べられたわけなので、そのプロセスがどうであ…

Pythonクラスのメソッド名解決順序

昨日のプロシンで「枝分かれのあるプロトタイプチェーンがあるときにメソッド名の解決はどうなるのか」「PythonではC3直列化でシリアライズして端から探索していく」という話をしたのですけど、PythonのC3直列化が入ったクラスが親クラスを書き換え可能かど…

IBMモデル1に言語モデルを追加した

先日のIBMモデル1の実装に関して、なんで「house house house」ってなってしまうのかについて考察した。与えられたデータだけからは、dasがhouseなのか、Hausがhouseなのか、istがhouseなのかわからない。だから確率値もイコールになっていて、argmaxした際…

IBMモデル1を実装した

学習後の変換確率: 入力データはこんな感じ raw_data = """ das Haus ist klein the house is small das Haus ist schmutzig the house is dirty das Haus ist sauber the house is clean Ich habe einen Stift I have a pen Ich liebe dich I love you eine…

テンピュールの三角座布団体験記

妻がクリスマスプレゼントにテンピュールの三角座布団(テンピュール(R) PCシートクッション)を買ってくれたので喜んで使っている。会社の机ではこんな感じ。自宅では正座の間に挟んだり、床に引いたりを適当に混ぜている。というのも下がホットカーペット…

年末年始に見たDVD

押井守監督のうる星やつらの独特の雰囲気とか、WALL-Eの「主人公もヒロインも言語を話さないSF」っぷりとかが、予想を大いに裏切ってくれて面白かったです。

Sphinxでrawディレクティブを使って改ページ

Sphinxを書籍の原稿執筆に使っていると、例えば「節見出しの前では改ページして欲しい」なんてニーズがあるわけです。僕の場合HTMLで出力していて、外でレビューするときだけそのHTMLを印刷して持って行っているので、改ページして欲しい所にrawディレクティ…