集合知を活用したWebシステムとしてのPodcastle

江渡 浩一郎

独立行政法人 産業技術総合研究所

情報技術研究部門 情報流デザイングループ

なぜWiki小話でPodcastleの話なの?

  • 塚本「Podcastleって、Wikiなんですか?」
  • PodcastleとWikiはどんな関係があるのか?
  • Podcastleとは何か、Wikiとは何かを考える必要がある
  • Wiki小話でPodcastleの話をすることに

Podcastleとは何か

  • 検索できる閲覧できる編集できる
  • 3つの違う顔を持つWebサイトである
  • 検索する → 検索サイト?
  • 閲覧する → RSSリーダー?
  • 編集する → Wikiサイト?

新しい検索サービスの形

集合知によるシステムの改善

  • 実は昔からある

CD-DB

  • 音声トラックデータから情報を自動的に取得
  • CDのタイトル、アーティスト、曲名が取得できる
  • データが存在していない場合はユーザが入力できる
  • 結果、極めてマイナーなCDでも情報が取得できる
  • Webで情報入力 → CDプレイヤーで利用

ソーシャルブックマークのタグ

  • URLを登録する際にタグをつける
  • たくさんの人がタグをつけることによって、もっともらしいタグが推測されるようになる
  • タグをつけるのは手間だが、集合すると利便性が向上
  • プラスのフィードバックループが発生する

ネットを日本語化する:Japanize

Podcast => ポッドキャスト
Speech Recognition => 音声認識
  • 非常に平易な翻訳の組で表現している
  • インタフェースを平易にすることで参加者増を狙う
  • 参照: 奥一穂、WEB+DB PRESS Vol.36

Amazon Mechanical Turk

  • Amazon Mechanical Turk
  • 人間しかできないと思われる動作を、プログラムの一部として記述する
  • 例: 翻訳、画像の認識、一般的な知識の集積など
  • しかしこの試みはうまくいっていないように思われる
  • 人はお金で動くという誤った前提条件に基いている

Wikipedia

  • フリーの百科事典を作るという理想
  • 百科事典では無いにしても、知恵の集合となっている
  • Wikipediaをベースとした検索エンジンへと発展

集合知によって改善するWebシステム

  • CDのタイトル、Webサイトの翻訳情報、URLのタグ
  • Webで情報入力メタなレベルで利用

Podcastleの対象領域とは

  • Podcastleが必要とする集合知は何か

音声認識の本質的な弱点

  • 本質的に、音声認識は完全ではありえない
  • 人間でさえ、音声認識は完全ではない
  • 聞きとりにくい声は人間でも聞きとれない
  • 知らない単語は人間でも聞きとれない

音声認識の本質的な弱点(2)

  • しかし、人は機械に完全を求める
  • 人が聞きとれなくても機械は聞きとれるはずと思う
  • 人が知らない単語でも機械は知ってるはずと思う
  • 機械は完全であるという幻想を持っている

音声認識を人間が補完する

  • 機械が聞きとれない単語でも、誰かは聞きとれるはず
  • 機械が知らない単語でも、誰かしら知ってるはず
  • その「誰か」は、どこにいるのか?

集合知による音声認識の改善

  • 音声認識の持つ本質的な弱点を集合知で改善する
  • 「誰か」は、改善できるに違いない
  • その「誰か」は、どこにいるのか?
  • そこでWeb 2.0ですよ
  • 「誰か」が聞きとったテキストがみんなの役に立つ

PodcastleとWikiの関係

  • 結局、集合知の活用という点では共通している
  • Web 2.0の未来は明るいぞ

MashUp.request

  • Plaggerとの連携
  • microformatsによる情報取得

Plaggerとの連携

  • PodcastleからどんなRSSを吐けばいい?
  • iPod用RSSなどいろいろな要求がありうる
  • とても全部の要求には答えられそうにない
  • そこで「それPla」ですよ
  • Podcastleは最小限のRSSを提供する
  • それを元にPlaggerで任意のRSSを生成する
  • どっちもウマー

「読み」のmicroformats

  • 言葉の読みを自動的に取得したい
  • 蒼井優
<p><b>蒼井 優</b>(あおい ゆう、
  • microformatsを使ってみる
<p><b><span class="kanji">蒼井 優</span></b>
(<span class="yomi">あおい ゆう</span>、
  • 最小限の努力で読みを指定できる
  • クラス名はもうちょっといいのが無いかなぁ

まとめ

  • 集合知を活用したWebアプリケーションの夜明け
  • マッシュアップで行こう
  • Web 2.0の未来は明るいぞ
Last modified: 2007-01-09