Wikimedia Conference Japan 2010 の Tech Talk に参加してきましたよというお話。
まずは、なんと旅費なしで来日公演してくれたという、Wikimedia Foundation の Ryan Lane さんをはじめとして、楽しいテーマを取り扱ってくれた、森さん・中山さん、そして開催するにあたって活動していた方々にお礼を申し上げたい。
Thank you for the great conference!
とりあえず、気になったトピックをいろいろ述べてみます。
森さん・中山さんの講演
森さんはHadoopを使ってWikipediaのデータを解析しちゃうぜ、というお話。Hadoop初心者なので、いきなりあわわなレベルで来てしまったら理解出来ないだろうな…と思いきやすごく、分かりやすい説明でした。
Wikipediaのテキストをそのまま解析するので、複雑な記法になると解釈ができなくなる問題はありそうです。
一方、中山さんはMediaWikiの方にあるクラス群やテーブル構造を使った解析をやっていました。
双方とも、共通してデータを構造化してみるという部分がありましたが、MediaWiki自体にはデータを構造化する仕組みは現状そろっていないので、どうしても苦しいような気がしました。仮に構造化されるのであれば、新たな記法や強制的に何かを入力させるということになっていきそうですが、一方で簡単に参入できるというメリットを失うことになるかもしれません。
Ryanさんの講演
印象深いことがいろいろあったので、先にこちらをまとめる。
テーマは、「MediaWiki開発者コミュニティに参加するには」という
ことでMediaWiki開発者コミュニティにどんどん参加してくれー
っていうことを中心に話しておられた。
英語リスニングがダメダメなので、たまに聞こえるというレベルでしたが
無料イベントなのに逐次の翻訳があるという豪華な状態で助けられました。
おもにOpenPNEというOSSにかかわってしまっているという状態のため
ほかのプロジェクトのOSSに対する考え方というのは聞けてよかったです。
OSS参加についてのトピックをまとめ
- 指導すること、されること。
- 取り込みは素早く、リリースはどんどんやるスタイルである。(伽藍とバザールで読んだような内容だ。)
- 議論のメインストリームはML。
- レポジトリの取り込みは素早いが、コードチェックは慎重。
- コミュニケーションは重要。
- 言語の壁を恐れず参加して欲しい。
門戸は空いているので、どんどん来てくれ!!っていうのをアピールしておられました。その上で、もしやるとするならば一番深刻な脆弱性に気をつけてくれってことで、幾つかの脆弱性の紹介(SQL Injection, XSS, CSRF)をされていた。
後の質問で、テスト体制 (UnitTestなど)が質問に挙がっていて、PHPUnit や Selenium を使っているようでしたが、完全ではないです。「難しいし、大変だから助けて欲しい」ということを言っていました。
今回Ryanさんは旅費なしで日本に来てくださった上に、普段からMediaWikiにお世話になっている身としては、全然日本語化されていないコーディングルールの翻訳も含めてサポートしていきたいと感じました。 * 自分がメンテナーやっているOSSのほうも大事だけどね 🙂