tweepyでStreaming API

id:nekomusha6:20110121:1295606221 でライブラリがtweepyに決まったので、次はアプリケーションの作成になります。 お題 tweepyを使ってフォローしている人のつぶやきをStreaming APIを使って拾う はじめに twitterのAPIには、公式*1 *2によると現在以下の3…

ubuntu & pythonでtwitter

gwibberによる収集もいいのですが、BOTによる自動収集で規模を増やしたくなりました。そこで今更ですがpythonからtwitter APIを使うことにします。 本日のお題 ライブラリ(twitter APIのpythonラッパーモジュール)何にしましょう? 結論 PPAからpython-tweep…

MySQL対応

その人を表す特徴的な単語*1で書いたコードをMySQLに対応させてみました。https://github.com/nekomusha/public/tree/hatena20110120/twitter_statistics/src *1:id:nekomusha6:20110113

SQLAlchemy+MySQL Unicode文字列の怪

Python2.Xで日本語を扱うときUnicode文字列への/からの変換時に面倒な問題があるらしく*1、コード内ではどちらかに統一したいと思うらしいです(そう思います)。しかしSQLAlchemyにはPlane/Unicodeどちらで渡す/から返される文字列はどちらなのか仕組みがよく…

SQLAlchemy+MySQLでUpdate文に失敗

ハマった問題の原因調査結果です。 現象 sqlalchemy.orm.exc.ConcurrentModificationError: Updated rowcount 0 does not match number of objects updated 1原因不明なこんなメッセージに悩まされてました。 再現条件 SQLAlchemy MySQL アダプタがMySQLdb …

Python開発環境 on Ubuntu 10.10

普通はemacsかvimか、もしくはNetBeansと言ったところ(WindowsだとPyScripterとかも。wineでどうかとかは知りません。)なんでしょうが、eclipseでのPython開発環境構築方法をメモっておきます。先に断っておくと環境にもpythonにも詳しくなくまだ勉強中の身…

その人を表す特徴的な単語

gwibberにあるデータからなんか統計処理できないかと考えてみた。 お題 Twitterで(勝手に)フォローしてる人固有の特徴的な単語上位3つを挙げる 結果 頻度の高い方順に5人抽出しました。 ID 1 2 3 mitukiii 金沢 screen mitukiii repeatedly gakisp Andrei 学…

gwibberでtwitter

ubuntu標準のgwibberというアプリがtwitterを使え、よく見ると自分の(糞)アプリと同じpythonで書かれています。これいじった方が早いかも...。 お題1 メッセージをフィルタリングしたい こうしてみた /usr/share/pyshared/gwibber/gwui.pyのMessageStreamVie…

ubuntu & pythonで形態素解析

pythonなどのお勉強のためにやってみた。 お題 「Googleが今まで立ち上げてきたプロジェクト(検索、ブックサーチ、YouTube買収、Googleアース、ストリートビューなど)の舞台裏が書かれていて興味深かった。」 を解析し、名詞をリストアップ。 Yahoo!の形態…