• Digital Library
    • Robert E. Kahn and Vinton G. Cerf, The Digital Library Project, Technical Report, Corporation for National Research Initiatives, 1988.
  • WAIS (Wide Area Information Servers)
    • Originally Z39.50-1988 was used for client-server communication. Thinking Machines' WAIS server has the directory-of-servers.
    • Jeff Kellem, WAIS, A Sketch Of An Overvie
  • Harvest
    • Gatherer/Broker architecture. Exploits classification systems (e.g., Dewey Decimal System, Library of Congress Classification System) for ranking.
    • U. Manber, How to Find It: Research Issues in Distributed Search, invited talk at the 10th Annual ACM Symposium on Parallel Algorithms and Architectures, 1998.
    • M. Bowman, Peter B. Danzing, Udi Manber, Michael F. Schwartz, Scalable Internet Resource Discovery: Research Problems and Approaches, Comm. of the ACM. Vol. 37, No. 8, pp. 98-107, 1994.
    • C. M. Bowman, P. B. Danzig, D. R. Hardy, U. Manber, and M. F. Schwartz, The Harvest Information Discovery and Access System, Computer Networks and ISDN Systems, Vol.28, pp.119-125, 1995.
    • Sarah Elizabeth Burcham, Harvest , ACM Crossroads, 1995.
  • Ultraseek
  • ROADS (Resource Organization and Discovery in Subject-based Services)
    • IAFA, whois++を使っている.
  • CAFE
    • 文書のn-gram統計のcentroidをmetadataとして使っている. 関連するシステムとして,TELLTALE がある.
    • Grace Crowder and Charles Nicholas, Resource Selection in CAFE: an Architecture for Network Information Retrieval, Networked Information Retrieval workshop at SIGIR'96, 1996.
    • Claudia Pearce, Ethan Miller, The TELLTALE Dynamic Hypertext Environment: Approaches to Scalability, Advances in Intelligent Hypertext (J. Mayfield and C. Nicholas (Eds.)), LNCS 1326, pp. 109-130, Springer-Verlag, 1997.
    • オントロジーをmetadataとして使っている.
    • X. Zhu, et. al, Ontology-Based Web Site Mapping for Information Exploration, Proceedings of the 8th International Conference on Information and Knowledge Management, pp. 188-194, 1999.

  • Ant World
    • Based on query (Quest) matching using machine learnig technique (LAD).

  • Database selection
    • James P. Callan, Zhihong Lu and W. Bruce Croft, Searching Distributed Collections With Inference Networks, in Proceedings of the 18th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 21-25, 1995.
    • James Allan, James P. Callan, W. Bruce Croft, Lisa Ballesteros, Donald Byrd, Russell C. Swan and Jinxi Xu, INQUERY Does Battle With TREC-6, in Proceedings of the 6th Text Retrieval Conference (TREC6), pp. 169-206, 1997.
    • J. Xu and B. Croft, Cluster-based Language Models for Distributed Retrieval, in Proceedings of the 22nd International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 254-261, 1999.
    • Allison L. Powell, James C. French, James P. Callan, Margaret E. Connell and Charles L. Viles, The Impact of Database Selection on Distributed Searching, in Proceedings of the 23rd International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 232-239, 2000.

  • Outgoing linkを使ったWeb検索
  • Jungle Monkey
  • Gnutella
    • Clients search for files by flooding the mesh with search messages. Each message has a TTL to limit its spread.
    • E. Adar and B. A. Huberman, Free Riding on Gnutella.
  • Napstar
    • A central Napster server has a list of the data (MP3) clients. MP3 data should be retrieved directly from the origin client, not from the server.
    • OpenNap: Open Source Napster Server
  • Freenet
    • A distributed file publication system. Similar to Gnutella, but more efficient and scalable with intelligent routing and caching (Adaptive Network architecture).
      The basic design is:
      - ``closeness'' is defined over keys associated to resources.
      - queries are forwarded based on the closeness.
      - information is cached at remote system.
      - least-recently-accessed data (cache as well as original data) is removed.
  • JXTA Search
    • search providerは予め何を提供できるかをregisterする. ユーザからのqueryに対してresolverがregistrationとのマッチングをとり, 適切なproviderを選び出す.その結果をもとに,query routingが行なわれる.
    • Steve Waterhouse, JXTA Search: Distributed Search for Distributed Networks, White Paper, 2001.
  • P2P-style persistent data store
    • Plaxton Mesh
    • OceanStore
    • Tapestry
    • CAN
      Sylvia Ratnasamy, Paul Francis, Mark Handley, Richard Karp, and Scott Shenker, A Scalable Content-Addressable Network, in Proceedings of the ACM SIGCOMM 2001, San Deigo, CA, August 2001.
      Distributed hash table. keyからn個のhash codeを生成しn次元affine空間内の点に対応させる. n次元affine空間は複数のノードによって分担して分散管理される. 各ノードは分担領域の近傍を管理するノードに関する知識を持ち, query routingを行なう.
    • CHORD
      Ion Stoica, Robert Morris, David Karger, M. Frans Kaashoek, and Hari Balakrishnan, Chord: A Scalable Peer-to-peer Lookup Service for Internet Applications, in Proceedings of the ACM SIGCOMM 2001, San Deigo, CA, August 2001.
      consistent hashingを応用したdistributed hash table.
    • Pastry
    • JXTA Distributed Indexing
    • Adriana Iamnitchi, Comparison of 3 name-based search P2P systems.
      CAN, Chord, Tapestry/OceanStoreの比較.
  • Grid Computing

  • Dublin Core
  • RDF (Resource Description Framework)
    • sitemap, content rating, stream channel definition, search engine data collection (web crawling), digital library collection, distributed authoring などのための フレームワーク. RDF page at W3C参照.
  • RSS (RDF Site Summary)
  • IAFA (Internet Anonymous FTP Archives) Templates
  • SOIF (Summary Object Interchange Format)
    • Harvestで使われている.
  • SHOE (Simple Hypertext Ontology Extensions)
  • GDA (Global Data Annotation)
    • Koiti Hasida, Global Document Annotation, Natural Language Processing Pacific Rim Symposium'97, 1997.
  • CDF (Channel Definition Format)
  • Semantic Transcoding
    • 長尾確, アノテーションに基づくデジタルコンテンツの高度利用, 情報処理, Vol. 42, N0. 7, 2001.


World Wide Web
  • Webの歴史
  • Webの大きさ
  • Webの構造
    • HITS (Hyperlink-Induced Topic Search)
      J. Kleinberg, Authoritative sources in a hyperlinked environment, Proceedings of the 9th ACM-SIAM Symposium on Discrete Algorithms, pp. 668-677, 1998.
      二部グラフをなしているオーソリティとハブ.Clever Project at IBM.
    • PageRank
      • S. Brin and L. Page, The Anatomy of a Large-Scale Hypertextual Web Search Engine, Proc. of the 7th International World Wide Web Conference, 1998.
        「価値のあるページは,多くの価値あるページから参照されている」 という再帰的な関係に注目し,各ページの重要度を算出. これは,ユーザがランダムにリンクを辿るという状況下で, ページがアクセスされる定常確率に相当. Google の秘密 - PageRank 徹底解説 by 馬場肇さん.
      • Sepandar D. Kamvar, Taher H. Haveliwala, Christopher D. Manning, Gene H. Golub, Extrapolation Methods for Accelerating PageRank Computations, Proc. of the 12th International World Wide Web Conference, 2003.
    • Chris Ding, Xiaofeng He, Parry Husbands, Hongyuan Zha, Horst Simon, PageRank, HITS and a Unified Framework for Link Analysis, LBNL Tech Report 49372, 2001.
    • Diameter of the World Wide Web
      Réka Albert, Hawoong Jeong, and Albert-László Barabási, Nature, 401, pp. 130-131, 1999.
      Webの直径は19ホップ. ページごとのリンク数(degree)の分布はベキ法則に従っている. Webページのout degreeが k である確率は k-2.45, in degreeが k である確率は k-2.1
    • Graph structure in the Web
      A. Broder, R. Kumar, F. Maghoul, P. Raghavan, S. Rajagopalan, R. Stata, A. Tompkins, and J. Wiener, Proceedings of the WWW9 Conference, 2000.
      Webの構造は蝶ネクタイ(Bow Tie)のようになっている. 互いに密に継っている``strongly connected component''(SCC)が全体の30%で, そこへ至るリンクを持つもの,そこからリンクでつながれているものが24%ずつ. 残りの22%はSCCとつながりをもたない.
    • Jon Kleinberg, Steve Lawrence, The Structure of the Web, Science, Vol. 294, No. 5548, pp. 1849-1850, 2001.
    • David Pennock, Gary Flake, Steve Lawrence, Eric Glover, C. Lee Giles, Winners don't take all: Characterizing the competition for links on the web, in Proceedings of the National Academy of Sciences, 99(8), pp. 5207-5211, 2002.
      被リンクにおける"rich get richer"の度合はカテゴリごとに異なる. カテゴリによっては,popularityの格差がそれほどないこともある.
    • 生命のごとく成長するWebの向かう先は? at 気になる科学探検隊
    • 松尾豊, 大澤幸生, 石塚満, ユーザの心理的距離に則したWebページ間の新しい距離の定義, 情処論文誌 Vol. 44, No. 1, pp. 88-94, 2003.
    • Einat Amitay, David Carmel, Adam Darlow, Ronny Lempel, Aya Soffer, The Connectivity Sonar: Detecting Site Functionality by Structural Patterns, in Proceedings of the 14th conference on Hypertext and Hypermedia (HyperText03), 2003.
      Webサイトには,その機能を反映したリンク構造の特徴(structural signature)がある. そのstructural signatureに基づきサイトを8種類に自動分類. 成功率はおよそ5割強,ものによっては85%を越えるものも.
    • Marco Gori, Ian Witten, The Bubble of Web Visibility, CACM, Vol. 48, No. 3, pp. 115-117, 2005.
      link farmやcloakingなどの 検索結果におけるページの順位を不当に上げる工作が乱用される結果として 経済における``バブル''のような状況がもたらされる. それを回避する方法としては, ページの中身を自動的に解釈する技術が有望.
    • complex network
  • 生態系としてのWeb
    • Web Forager, Web Ecologies at Xerox Parc
      • S. K. Card, G. G. Robertson, and W. York, The WebBook and the Web Forager: An Information Workspace for the World-Wide Web, ACM Conference on Human Factors in Software (CHI '96), pp. 111-117, 1996.
      • J.E. Pitkow, Characterizing World Wide Web Ecologies, 1997.
      • Peter Pirolli, Patricia Schank, Marti Hearst, Christine Dieh, Scatter/Gather Browsing Communicates the Topic Structure of a Very Large Text Collection, in Proceedings of the SIGCHI conference on Human factors in computing systems, pp. 213-220, 1996.
        普通の検索エンジンよりScatter/Gatherを使った方が, 検索対象トピックに関する深い理解(メンタルモデル)が得られる. また,Scatter/Gatherを用いるとトピックに対するユーザ間の共通理解 (互いに類似したメンタルモデル; coherent conceptual image)が得られる. Scatter/Gather
      • Peter Pirolli, Stuart Card, The Evolutionary Ecology of Information Foraging, 1997.
    • 北陸先端大 林研究室
      • 林幸雄, 「ネットワーク生態系」 in ナレッジサイエンス 知識科学を知る64のキーワード, 紀伊國屋書店, 2002.
  • Web情報検索
  • Webにおけるコミュニティ
    • (共通の話題を扱っている)webページの集まりをコミュニティとみなす, というアプローチ.
    • A. Broder, S. Glassman, M. Manasse, and G. Zweig, Syntactic Clustering of the Web, in Proceedings of the 6th International World Wide Web Conference, World Wide Web Consortium, pp. 391-404, 1997.
      文書Dを語のシーケンスとみなし, 長さwのサブ・シーケンス全体の集合S(D,w)の一致度から類似性を判定する. 具体的には, 文書A,Bの類似度を|S(A,w)∩S(B,w)|/|S(A,w)∪S(B,w)|で測る.
    • Ravi Kumar, Prabhakar Raghavan, Sridhar Rajagopalan, Andrew Tomkins, Trawling the web for emerging cyber-communities, 1999.
    • 豊田正史, WWWにおける関連コミュニティ群の発見, 情報処理学会研究会報告, 2000-DBS-122-40, 2000.
      二部グラフ. 与えられたシードの近傍から, 互いに関連しあう複数のコミュニティを抽出. 近傍の構成・リンクのウェイト決定にHITS , Companion, Companion+の3手法を使い比較. 精度が高かったのはCompanion+.
    • Naohiro Matsumura, Yukio Ohsawa, and Mitsuru Ishizuka, Future Direction of Communities on the Web, in Proceedings of JSAI 2001, LNAI 2253, pp. 435-443, Springer-Verlag, 2001.
      二部グラフ. コミュニティ間でco-citation関係の強いものをestablished relations, 弱いものをfuture directionsとみなす.
    • 村田剛志, 参照の共起性に基づくWebコミュニティの発見, 人工知能学会誌, Vol. 16, No. 3, pp.316-323, 2001.
    • Gary Flake, Steve Lawrence, C. Lee Giles, Frans Coetzee, Self-Organization and Identification of Web Communities, IEEE Computer, 35:3, March 2002.
      最大流量・最小カット定理をリンク構造解析適用し,Webコミュニティを抽出. ここでいうWebコミュニティとはWebページの集合で, その各要素が コミュニティの外部へのリンクより内部へのリンクを多く持つもの.
    • 野村早恵子, 三木武, 石田亨, コミュニティマイニングにおけるWeb引用解析と文献引用解析の比較, 電子情報通信学会論文誌, Vol. J87-D-I, No.3, pp.382-389, Mar., 2004.
      Webのリンク構造から推定されるコミュニティ(個人Webサイトの共引用関係)と 実際のコミュニティ(文献の共引用関係)の比較. Webにおけるコミュニティ(共引用関係によるクラスタ)は 実際のコミュニティのスーパーセットになっている.
  • 視覚化
  • Semantic Web
    • Tim Berners-Lee, James Hendler and Ora Lassila, The Semantic Web, Scientific American, May 2001.
    • W3C Semanic Web
    • Tim Berners-Lee, Mark Fischetti (Contributor), Weaving the Web : The Original Design and Ultimate Destiny of the World Wide Web by its Inventor, Harper San Francisco, 1999. (高橋徹 監訳, Webの創成, 毎日コミュニケーションズ, 2001.)
    • Semantic Transcoding
      Katashi Nagao, Shingo Hosoya, Kevin Squire, Semantic Transcoding: Making the World Wide Web More Understandable and Usable with External Annotations, WIT 2000, 2000.
    • 知識共生
      武田英明, 市瀬龍太郎, 村田剛志, 本位田真一, 知識共生 −新しい知識流通の基盤を目指して−, 人工知能学会全国大会(第16回)論文集, 2C3-01, 2002.
    • 萩野達也(編), 特集:セマンティックWeb, 情報処理, Vol. 43, No.7, pp. 708-750, 2002.
  • Webマイニング
    • Web IR & IE
    • Raymond Kosala, Hendrik Blockeel, Web Mining Research: A Survey, SIGKDD Explorations, Vol. 2, No. 1, pp. 1-15, 2000.
    • Jaideep Srivastava, Robert Cooley, Mukund Deshpande, Pang-Ning Tan, Web Usage Mining: Discovery and Applications of Usage Patterns from Web Data, SIGKDD Explorations, Vol. 1, No. 2, pp. 12-23, 2000.
    • Soumen Chakrabarti, Sandeep Srivastava, Mallela Subramanyam, Mitul Tiwari, Using Memex to archive and mine community Web browsing experience, in Proc. of the 9th International World Wide Web Conference, 2000.
    • Brij M. Masand, Myra Spiliopoulou, Jaideep Srivastava, and Osmar R. Zaïane, WEBKDD 2002 - Web Mining for Usage Patterns & Profiles, SIGKDD Explorations, Vol. 4, No. 2, pp. 125-127, 2003.
    • 山西健司, Webマイニングと情報論的学習理論, 2002年情報学シンポジウム 招待講演, 2002.
    • WebFountain at IBM Almaden Research Center
      応用事例として, Semagixと共同で金融機関向けマネーロンダリング対策システムを開発. Citibankに導入されるらしい....
  • Webダイナミクス
    • 特集:Webダイナミクス, 情処学会誌, Vol. 44, No. 7, 2003.
      • Web適応
      • Web上の推薦システム
      • Webコミュニティ
      • Webにおける情報統合 — セマンティックWebとWebサービス —
        Semantic Web
      • Web更新モニタリング
        ChangeDetect, WeSpector.
      • Web情報ストリーム
        Topic Detection and Tracking (TDT), ThemeRiver. 時間的つながりを利用した検索
  • Webの使われ方
    • アクセスパタン
      • 大久保雅且, 杉崎正之, 井上孝史, 田中一男, WWW検索ログに基づく情報ニーズの抽出, 情報処理学会論文誌, Vol.39, No7, pp. 2250-2257, 1998.
        検索履歴を解析して それぞれの時期に同義語として用いられた検索語を集約し, 「トレンド」を抽出する.
      • Robert Cooley, Bamshad Mobasher, Jaideep Srivastava, Data Preparation for Mining World Wide Web Browsing Patterns, Knowledge and Information Systems, Vol. 1, No. 1, pp. 5-32, 1999.
      • Craig Silverstein, Monika Henzinger, Johannes Marais, Michael Moricz, Analysis of a very large AltaVista query log, Technical Report 1998-014, Compaq Systems Research Center, 1998.
      • B. J. Jansen, A. Spink, J. Bateman, T. Saracevic, Real Life Information Retrieval: A Study of User Queries on the Web, SIGIR Forum, 32(1), pp. 5-17, 1998.
      • Nicola Moss and Greg Hale, Cognitive Style and Its Effect on Internet Searching: A Quantitative Investigation, European Conference on Educational Research, Lahti, Finland, 1999.
      • GVU's WWW User Survey
        ユーザの45.4%は "Not being able to find the information I am looking for." と言っている. また "Not being able to find a page I know is out there." と言っているユーザも 30.0% いる.
      • Linda Tauscher and Saul Greenberg, Revisitation Patterns in World Wide Web Navigation, in Proceedings of the CHI '97 Conference. 1997.
      • Yahoo!/ACNielsen Internet Confidence Index
      • Steve Outing, Eyetrack Online News Study May Surprise You, Editor & Publisher Online, 2000.
        アイカメラによる視線の追跡. 画像データによるバナー広告を注視する時間は少なく むしろヘッディング文字列に注意が向いている,という解析結果. 注視時間が少ないからと言ってバナーの効果が少ないと結論付けることは できないのでは? 画像の方が短時間で認識できているとも考えられる.
      • Matthew M. Williamson, Throttling Viruses: Restricting propagation to defeat malicious mobile code, HPL-2002-172, 2002.
        コンピュータウィルスによって生じる通信は 短い時間に数多くの相手に対して行われるという点で Webのbrowsingなどによって生じる通常の通信と異なる. この特徴を利用してウィルス感染の可能性を検出し, 疑わしい通信にはペナルティを課すことで蔓延を遅らせる. browsingのトラフィック(コネクション発生度)はほぼ0.5〜1Hz以下, Code Redウィルスに感染した場合は200Hz以上.
      • Brian D. Davison, Predicting web actions from HTML content, in Proceedings of the 13th conference on Hypertext and hypermedia, pp. 159-168, 2002.
      • Natalie S. Glance, Community search assistant, in Proceedings of the International Conference on Intelligent User Interfaces, pp. 91-96, 2001.
        Query Graph. 検索語をノードとし, 2つの検索語の検索結果上位10件内に共通のページがある場合にそれらの間に関係があるとみなしリンクをはる. このグラフを利用して,類似した検索語を提示. 検索エンジンとしてGoogleとAltavistaを利用し,グラフを比較.
      • Mark Ruddell, Using Eye-Tracking Data to Understand First Impressions of a Website, Usability News, Vol. 7, Issue 1, 2005.
      • iProspect Search Engine User Behavior Study
        62%のユーザはWeb検索結果の最初のページしか見ない. 最初の3ページに探している情報が見つからない場合, 4ページ以降を見ることなく検索語を変えるなどして検索をやりなおすユーザが 全体の88%.
      • ユーザプロファイリング
    • 利用調査
    • Web Usability
    • Bookmark
      • KFTF (Keeping Found Things Found)
        • W. Jones, H. Bruce, S. Dumais, Keeping found things found on the Web, in proceedings of the 2001 ACM CIKM 10th International Conference on Information and Knowledge Management, pp. 119-134, 2001.
        • W. Jones, S. Dumais, H. Bruce, Once found, what then?: a study of "keeping" behaviors in personal use of Web information, in Proceedings of the 65th ASIST Annual Meeting, pp. 391-402, 2002.
          information specialistとその他のユーザを比較すると,bookmarkの利用率に大きな違いが見られる. Bookmarkはアクセス性(可搬性), 管理の容易さ, 統合的な情報利用への寄与の可能性などに改善の余地がある.
      • Bookmarkを利用した情報探索支援
    • 広告
    • インタラクティブなコンテンツ編集(Web出版)
      • Weblog
        • Movable Type
        • blogってどうよ? @HOTWIRED Japan
        • Ravi Kumar, Jasmine Novak, Prabhakar Raghavan, Andrew Tomkins, On the Bursty Evolution of Blogspace, in Proceedings of the twelfth International World Wide Web Conference, 2003.
        • 未来検索livedoor by 有限会社未来検索ブラジル
          Blog検索エンジン. 新しい検索結果をメールで通知. 検索結果をRSSで出力.RSSリーダで最新の検索結果の追跡が可能.
        • 三浦麻子, 山下清美 (企画), 日本社会心理学会第44回大会ワークショップ ``電子コミュニティの歴史的変遷と社会心理学 −日本型blogは匿名掲示板?それともWeb日記?−,'' 2003.
        • 公文俊平, 楠正憲, 濱野智史, 上村圭介, 石橋啓一郎 (対談), ブログとソーシャルネットワークの現在形, 2004.
          ブログハンター,二次的コンテンツ, wikiはなぜ荒されないか,blogとwikiの比較,など.
        • 武田英明, 大向一輝, Weblogの現在と展望 −セマンティックWebおよびソーシャルネットワーキングの基盤として−, 情報処理, Vol. 45, No. 6, pp. 586-597, 2004.
        • BlogPulse by Intelliseek
        • Eytan Adar, Li Zhang, Lada A. Adamic, Rajan M. Lukose, Implicit Structure and the Dynamics of Blogspace, Workshop on the Weblogging Ecosystem, 13th International World Wide Web Conference, 2004.
          blog上のinformation epidemicsの解析. 情報(独創的アイデア)は知名度の低いblogサイトで発生し, 知名度の高いblogサイトを経由して広まる. つまり,情報(独創的アイデア)を持つ人と 影響力(多くの人とのつながり)を持つ人は一般に異なる. iRank. Blog Epidemic Analyzer at HP Information Dynamics Lab.
        • Andrew Rosenbloom (ed), The Blogosphere, Communications of the ACM, Vol. 47, No. 12, 2004.
        • 山下清美, 川浦康至, 川上善郎, 三浦麻子, ウェブログの心理学, NTT出版, 2005.
      • Wiki
    • Chun Wei Choo, Brian Detlor and Don Turnbull, Information Seeking on the Web -- An Integrated Model of Browsing and Searching, in Proceedings of the 62nd Annual Meeting of the American Society for Information Science, pp. 3-16, 1999.
  • Web Characterization Activity (HISTORIC)

  • 基礎・総論・サーベイ
    • G. Salton, M. J. McGill, Introduction to Modern Information Retrieval, McGraw-Hill, 1983.
      tf・idf, ベクトル空間モデル, SMARTシステム.
    • M. R. Anderberg, Cluster Analysis for Applications, Academic Press, 1973.
    • Ian H. Witten, Alistair Moffat, and Timothy C. Bell, Managing Gigabytes: Compressing and Indexing Documents and Images, Morgan Kaufmann, 1999.
    • Ricardo Baeza-Yates, Berthier Ribeiro-Neto, Modern Information Retrieval, Addison-Wesley, 1999.
    • Andrew Kachites McCallum, "Bow: A toolkit for statistical language modeling, text retrieval, classification and clustering", http://www.cs.cmu.edu/~mccallum/bow, 1996.
    • 福本淳一, 天野真家 (編), 自然言語による情報アクセス技術, 情報処理, Vol. 45, No. 6, 2004.
      • 関根聡, 情報抽出, pp. 563-568.
      • 江口浩二, Web検索の技術動向と評価手法, pp. 569-573.
      • 奥村学, テキスト自動要約, pp. 574-579.
      • 福本淳一, 桝井文人, 質疑応答技術 − 大量のデータをもとに任意の質問に答える −, pp. 580-585.
    • 酒井哲也, よりよい検索システム実現のために: 正解の良し悪しを考慮した情報検索評価の動向, 情報処理, Vol. 47, No. 2, 2006.
  • LSI (Latent Semantic Indexing)
    • Scott Deerwester, Susan T. Dumais, George W. Furnas, Thomas K. Landauer, Richard Harshman, Indexing by Latent Semantic Analysis, Journal of the American Society of Information Science, Vol. 41, No. 6, pp. 391-407, 1990.
    • Latent Semantic Analysis @ CU Boulder
      Online (CGI) LSA. POST先のURLが間違っているので,ブラウザによっては動作しない場合も.
    • 竹内広宜, 小林メイ, 青野雅樹, 寒川光, 多変量解析法を用いた情報検索に関する一考察, 情処研究会報告, 2002-FI-66-12, pp. 87-93, 2002.
    • PLSI
      Thomas Hofmann, Probabilistic Latent Semantic Indexing, SIGIR '99, pp.50-57, 1999.
    • Semantic Aggregate Model
      持橋大地, 松本裕治, 意味の確率的表現, 情処研究会報告, 2002-NL-147-12, pp. 77-84, 2002.
  • Okapi
    • S. E. Robertson, S. Walker, S. Jones, and M. M. Hancock-Beaulieu, Okapi at TREC-3, in Proceedings of the third Text REtrieval Conference (TREC-3), 1994.
      Okapi BM25 function.
    • 岸田和明, 情報検索技術とテストコレクション   (特集:情報検索システムの力くらべ), 情報処理, Vol. 41, No. 8, Aug. 2000.
      確率型モデルは理論が先行し実用性に乏しかったが, TRECにおいて tf・idf を取り入れた Okapi が提案された. しかし,ベクトル空間モデルとの大きな性能の差はなく, tf と idf,それに dl(document length) の3つの要素を組み込んだ手法はそれなりの検索性能を示すということが, 適合度順序出力に関する TREC での1つの知見ということになっている.
  • 文書のクラスタリング
    • Scatter/Gather
      • Douglass Cutting, David Karger, Jan Pedersen, and John W. Tukey, Scatter/Gather: A Cluster-based Approach to Browsing Large Document Collections, in Proceedings of the 15th ACM International Conference on Research and Development in Information Retrieval (SIGIR'92), pp. 318-329, 1992.
      • Marti Hearst, Jan Pedersen, Reexamining the Cluster Hypothesis: Scatter/Gather on Retrieval Results, in Proceedings of the 19th ACM International Conference on Research and Development in Information Retrieval (SIGIR'96), pp. 76-84, 1996.
        検索結果をクラスタリングすると, 検索要求に合致する文書は1つのクラスタに集中する. よって,検索要求に合致するクラスタを選ぶことが検索結果閲覧の効率化につながる.
    • Inderjit S. Dhillon, Dharmendra S. Modha, Concept Decompositions for Large Sparse Text Data using Clustering, Machine Learning, Vol. 24, No. 1, pp. 143-175, 1999.
    • Inderjit S. Dhillon, Co-clustering documents and words using Bipartite Spectral Graph Partitioning, in Porceedings of ACM International Conference on Knowledge Discovery and Data Mining (KDD 2001), pp. 269-274, 2001.
    • Akiko Aizawa, A Method of Cluster-Based Indexing of Textual Data, in Proceedings of the 19th International Conference on Computational Linguistics (COLING 2002), pp. 1-7, 2002.
    • 相澤彰子, 低頻度語の利用によるテキスト分類性能の改善と評価, 情報処理学会論文誌, Vol. 44, No. 7, pp.1720-1730, 2003.
    • Michael Steinbach, George Karypis, Vipin Kumar, A Comparison of Document Clustering Techniques, in Proceedings of KDD Workshop on Text Mining, 2000.
    • Pavel Berkhin, Survey Of Clustering Data Mining Techniques, Datanautics Inc. Research Paper, 2002.
    • Webページのクラスタリング
    • S. Kaski, T. Honkela, K. Lagus, and T. Kohonen, WEBSOM -- self-organizing maps of document collections, Neurocomputing, Vol. 21, pp. 101-117, 1998.
    • K. Lagus, and S. Kaski, Keyword selection method for characterizing text document maps, in Proceedings of the 9th International Conference on Artificial Neural Networks (ICANN99), Vol. 1, pp. 371-376, 1999.
    • Kaski, S. (1998). Dimensionality reduction by random mapping: Fast similarity computation for clustering, in Proceedings of International Joint Conference on Neural Networks (IJCNN'98), Vol. 1, pp. 413-418, 1998.
      Random projection method. 文書集合の特徴を考慮せず,適当に(乱数で)作った行列で次元を下げる. LSIと比べて遜色ない精度が得られる.
    • T. Kohonen, S. Kaski, K. Lagus, J. Salojärvi, J. Honkela, V. Paatero, and A. Saarela, Self Organization of a Massive Document Collection, IEEE Transactions on Neural Networks, Special Issue on Neural Networks for Data Mining and Knowledge Discovery, Vol. 11, No. 3, pp. 574-585, 2000.
      文書の特徴ベクトルの次元を下げるため, 最初はWEBSOMでキーワードのクラスタリングをしていた. 現在はRandom projection methodを使っている.
    • T. コホネン, 自己組織化マップ, シュプリンガー・フェアラーク東京, 1996.
    • SOM_PAK (and LVQ_PAK), public-domain softare packages provided by Laboratory of Computer and Information Science of Helsinki University of Technology
    • Alfred Ultsch, Self organized feature maps for monitoring and knowledge acquisition of a chemical process, in Proceedings of Int. Conf. on Articial Neural Networks (ICANN'93), pp. 864-867, 1993.
      SOMの結果を視覚化するためのU-matrix methodについて. 近傍の特徴ベクタとの隔たりが大きい時に谷(濃い色)にする.
    • Riccardo Rizzo, Mario Allegra, Giovanni Fulantelli, Hypertext-like structures through a SOM network, in Proceedings of the 10th ACM Conference on Hypertext and Hypermedia, pp. 71-72, 1999.
      SOMで文書を組織化して, ハイパーテキストによる構造化(indexページやlink listの作成など)を支援する, というアプローチ. 実際のWebページ(162ページ)をSOM(5x8 lattice)で組織化すると, これらのページ間に張られている357リンクのうち, 同じneural unitに属するページ間には80リンク, 隣接するunit間には151リンク. つまり,SOMによるページ間の関連付けは実際のリンクの64.7%をカバーしている.
  • Web情報検索
    • Udi Manber, Mike Smith, Burra Gopal, WebGlimpse Combining Browsing and Searching, in Proceedings of 1997 Usenix Technical Conference, pp. 195-206, 1997.
      キーワード検索の範囲をページの近傍に制限. 近傍はハイパーリンクによるつながりをもとに構成.
    • K. Bharat and M. R. Henzinger, Improved algorithms for topic distillation in a hyperlinked environment, in Proceedings of the 21st International ACM SIGIR Conference, pp. 104-111, 1998.
      リンク情報(HITS) だけを用いた検索結果のランキングには topic driftが発生する可能性があることを指摘. drift回避にはContent Analysisとの併用が効果的.
    • Jeffrey Dean, Monika R. Henzinger, Finding Related Pages in the World Wide Web, the 8th International World Wide Web Conference, 1999.
      検索の問い合わせに語でなくURLを指定させ,その関連ページを抽出する. リンク構造解析に基づく2つのアルゴリズムを使用. Companion: vicinity graph(行って戻る/戻って行く)にHITSを適用. Co-citation: 共通のparentをもつsblingを選出.
    • Thomas A. Phelps and Robert Wilensky, Robust Hyperlinks: Cheap, Everywhere, Now, in Proceedings of Digital Documents and Electronic Publishing (DDEP00), 2000.
      <a href="..." lexical-signature="w1+w2+w3+w4+w5">...</a> のようにしてhyperlinkにリンク先のシグネチャ(特徴語の組)を付加し, broken linkの問題を回避する.シグネチャは5語で十分.
    • Outgoing linkを使った検索
      • Fish Search
        Paul De Bra, Reinier Post, Information Retrieval in the World-Wide Web: Making Client-Based Searching Feasible, Computer Networks and ISDN Systems, Vol. 27, No. 2, pp. 183-192, 1994.
      • SAE (Spreading Activation Energy)
        Peter Pirolli, James Pitkow, Ramana Rao, Silk from a Sow's Ear: Extracting Usable Structures from the Web, CHI '96, 1996.
      • InfoSpider
        検索エージェントがリンクをつたってページ間を移動. GA的手法で,エージェントが進化し,淘汰される.
      • 山岡克式, 内藤清一郎, 小林亜樹, 酒井 善則, 超分散サーチエンジン, 電子情報通信学会総合大会, B7-120, 2000.
        各Webサーバが自リソースだけでなくリンク先(数ホップ先まで) のリソースも収集して索引を作り,検索サービスを提供する. 関連システムとしてPIRCSがある.
      • 澤田雅人, 富田準二, 池田哲夫, 佐藤哲司, 分散型検索システムにおける連携型検索手法の提案, DEWS 2002, B2-2, 2002.
        ハイパーリンクをもとにサイト間に重み(人の判断で与える)つきリンクを生成. queryはリンクを伝わって伝搬. (検索問題に対する)正解は数ホップ内に集中して存在する.
    • Webページの類似性,クラスタリング
      • C. Chen, Structuring and Visualising the WWW by Generalised Similarity Analysis, in Proceedings of the 8th International ACM Conference on Hypertext and Hypermedia, 1997.
        類似性判定のアプローチは, hypertext linkage, content similarity, state-transition patterns の3種類に分類できる.
      • L. Terveen, et. al Constructing, Organizing, and Visualizing Collection of Topically Related Web Resources, ACM Trans. Coumputer-Human Interaction, Vol. 6, No. 1, pp. 67-94, 1999.
      • O. Zamir, O. Etzioni, Grouper: A Dynamic Clustering Interface to Web Search Results, in Proceedings of the 8th International World Wide Web Conference, 1999.
      • Taher H. Haveliwala, Aristades Gionis, Dan Klein, Piotr Indyk, Evaluating Strategies for Similarity Search on the Web, in Proceedings of the 11th International World Wide Web Conference, 2002.
        Webディレクトリの階層構造を類似性の基準とし, (既存の)類似ページ判定方法を評価.
      • Shoji Goto, Tadachika Ozono and Toramatsu Shintani, A Method for Information Source Selection using Thesaurus for Distributed Information Retrieval, in the Proceedings of the Pacific Asian Conference on Intelligent Systems 2001 (PAIS2001), pp.272-277, 2001.
      • Filippo Menczer, Links tell us about lexical and semantic web content, arXiv:cs.IR/0108004, 2001.
      • Filippo Menczer, Gautam Pant, Padmini Srinivasan, Miguel E. Ruiz, Evaluating topic-driven web crawlers, in Proceedings of the 24th annual international ACM SIGIR conference on Research and development in information retrieval, pp. 241-249, 2001.
      • Teuvo Kohonen, Samuel Kaski, Krista Lagus, Jarkko Salojrvi, Jukka Honkela, Vesa Paatero, and Antti Saarela, Self organization of a massive document collection, IEEE Transactions on Neural Networks, Vol. 11, No.3, 2000.
    • ユーザプロファイリング,エージェントによる情報獲得支援
      • Robert Armstrong, Dayne Freitag, Thorsten Joachims, and Tom Mitchell, WebWatcher: A Learning Apprentice for the World Wide Web, AAAI Spring Symposium on Information Gathering, pp. 6-12, 1995.
      • Mark S. Ackerman, Brian Starr, and Michael Pazzani, The Do-I-Care Agent: Effective Social Discovery and Filtering on the Web, In RIAO '97: Computer-Assisted Information Searching on the Internet, pp. 17-31, 1997.
        Webで新しい情報を見つける手段には active browser, index creation and lookup, generic Web change notifier, social filtering の4つがある. Do-I-CareはWeb change notifierとsocial filteringを結びつけたもの. ユーザが指定したページを定期的にチェックし, 面白いと思われるものを推薦する. また,発見した新しい情報はエージェント同士で共有する.
      • Ahmad M. Ahmad Wasfi, Collecting User Access Patterns for Building User Profiles and Collaborative filtering, in Proceedings of the 4th international conference on Intelligent user interfaces, pp. 57-64, 1998.
        エントロピーでページの重要度を測る. ページAを訪れた後にページBに行く確率が低い状況で, A→Bと閲覧するユーザにとってBは重要な情報を持っていると考える.
      • Dwi H. Widyantoro, Thomas R. Ioerger, John Yen, An adaptive algorithm for learning changes in user interests, in Proceedings of the 8th international conference on Information and knowledge management, pp. 405-412, 1999.
        複数ドメイン,長期/短期のユーザの興味を動的に捉える方法の提案. ユーザによるpositive/negative relevance feedbackを使う.
      • Stuart E. Middleton, Interface agents: A review of the field, Technical Report ECSTR-IAM01-001, University of Southampton, 2001.
        Web domainでは20弱のシステムがサーベイされている. ほとんどのシステムがtf・idf法を使って特徴を抽出している.
      • Gabriel L. Somlo, Adele E. Howe, Incremental clustering for profile maintenance in information gathering web agents , in Proceedings of the 5th international conference on Autonomous agents, pp. 262-269, 2001.
        Web information agentがユーザプロファイルを管理するにあたって, ユーザが関与するものと incremental clustering methodsを使って自動的に行うもの (passive modeling)2種(greedy and the doubling algorithm)を比較.
      • 砂山渡, 野村勇治, 大澤幸生, 谷内田正彦, Webページ検索におけるユーザの興味表現支援システム, 電子情報通信学会論文誌, Vol. J82-D-I, No.12, pp.1394-1402, Dec., 1999.
      • Bookmarkの利用
        • James Rucker, Marcos J. Polanco, Siteseer: personalized navigation for the Web, Communications of the ACM, Vol. 40, No. 3, pp. 73-76, 1997.
        • Henry Lieberman, Letizia: An Agent That Assists Web Browsing, in Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence (IJCAI-95), pp. 924-929, 1995.
          Letiziaはbrowsingを支援するエージェント. ユーザのブックマーク(にある文書のTF)をもとにプロファイルを作成. browsing中, リンク先のページの中からユーザのプロファイルにあうものを自動的に抽出.
        • 濱崎雅弘, 武田英明, 松塚健, 谷口雄一郎, 河野恭之, 木戸出正継, Bookmarkからの共通話題ネットワークの発見手法の提案とその評価, 人工知能学会論文誌, Vol.17, No.3, pp. 276-284, 2002.
        • 中島伸介,黒田慎介,田中克己, 閲覧履歴を反映したコンテクスト依存型Webブックマーク, 情報処理学会論文誌:データベース, Vol.43,No.SIG 5(TOD14), pp.23-36, 2002.
      • Social information filtering, recommender systems
    • サーベイ
      • 山名早人, WWW情報検索の現状, コンピュータソフトウェア, Vol. 14, No. 5, pp. 67-74, 1997.
      • 佐藤光弘, 梶浦正浩, 多田智之, 池野篤司, 森口修, WWWにおける情報検索技術の動向, 電子情報通信学会誌 Vol. 82, No. 12, pp. 1237-1242, 1999.
      • 福島俊一, WWW情報検索技術と評価の問題   (特集:情報検索システムの力くらべ), 情報処理, Vol. 41, No. 8, Aug. 2000.
        検索語はドメインを絞り込み, ページタイプは問題解決のタスクを絞り込む. 一方,新鮮度,引用度,人気度はコンテンツの信頼性を計る尺度である. TREC-8(1999) では,サブトラックとしてWWW情報検索が取り上げられた.
      • Mei Kobayashi, Koichi Takeda, Information retrieval on the web, ACM Computing Surveys, Vol. 32, No. 2, pp. 144-173, 2000.
      • 自然言語による情報アクセス技術
      • 馬場肇, 日本語全文検索エンジンソフトウェアのリスト
    • Webの構造
    • 検索エンジン最適化: SEO (Search Engine Optimization)
  • 記録 / 時間的つながりを利用した検索
    • Topic Detection and Tracking (TDT)
    • 野島久雄, 思い出工学, 日本認知科学会2001冬のシンポジウム「家の中の認知科学」講演資料集, pp. 31-41, 2001.
    • 考現学
    • Recall
      Internet Archiveを検索. 検索語, 関連語の出現頻度の時間的変化,関連カテゴリを表示.
    • Susan Havre, Elizabeth Hetzler, Paul Whitney, Lucy Nowell, ThemeRiver: Visualizing Thematic Changes in Large Document Collections, IEEE Transactions on Visualization and Computer Graphics, Vol. 8, No. 1, pp. 9-20, 2002.
    • 増井俊之, 近傍関係を活用した情報検索, 情報処理学会ヒューマンインタフェース研究会研究報告, 2003-HI-104, Vol.2003, pp. 53-58, 2003.
    • Web情報ストリーム
    • SIMILE Timeline project
  • Mapping Knowledge Domains
    • PNAS, Vol. 101 (Suppl. 1), April 6, 2004. (PNAS Online)
    • Introduction by Richard M. Shiffrin and Katy Börner
      ``The term "mapping knowledge domains" was chosen to describe a newly evolving interdisciplinary area of science aimed at the process of charting, mining, analyzing, sorting, enabling navigation of, and displaying knowledge.''

  • 言語の恣意性(Saussure)
    • 第一の恣意性
    • 第二の恣意性
      言語は客観的実在に名前を付けるもの(名称目録)ではなく, 名前を付けることにより世界からそのものを区別(差異化)している. 区別の仕方は言語体系によって様々. 色彩の分類.虹は,日本では7色,英語では6色,ドイツでは5色,.... (cf. メディアスケープフォーラム レクチャー・コラム by DNP.
  • 言語のダイナミクス
    • 言語ゲーム
      Ludwig Wittgenstein, Philosophical investigations, Macmillan, 1953.
      言語における語の使用がその語の意味. 言葉の意味を,言語を使ったゲームを行なうことでその都度作り上げている.
    • 橋爪大三郎, <言語>派社会学, in 「知の社会学/言語の社会学」, 岩波講座 現代社会学5, pp. 1-33, 1996.
    • 橋本敬, 動的言語観に基づいた単語間関係のダイナミクス (in 特集号「複雑系から見た知能創発」), 認知科学,Vol. 6, No. 1, 1999.
    • Einat Amitay, Trends, Fashions, Patterns, Norms, Conventions... and Hypertext Too, Journal of the American Society for Information Science (to appear). (also CSIRO TR 66-2000)
      Evolution of language conventions. InCommonSense system.
    • Martin A. Nowak, Natalia L. Komarova, Partha Niyogi, Computational and evolutionary aspects of language, Nature, Vol. 417, pp. 611-617, 2002.
  • LangE Project
    • Takaya Arita and Yuhji Koyama, Evolution of Linguistic Diversity in a Simple Communication System, in Proceedings of Artificial Life VI, pp. 9-17, 1998.
  • ヒトの言語機能
    • Chomsky
      生成文法. 言語機能は生得である.
    • S. Pinker, 言語を生み出す本能, 日本放送出版協会, 1995.
    • Sapir-Whorfの仮説
      • 人間は言語を媒介にして世界を認識する. 異なる言語からは異なる認識が生まれる.
      • E. Sapir, The Status of Linguistics as a Science, Language, Vol. 5, pp. 207-214, 1929.
      • Benjamin Lee Whorf, Science and Linguistics, Technology Review, Vol. 42, 1940.
    • Elissa L. Newport, Maturational constraints on language learning. Cognitive Science, 14, pp. 11-28, 1990.
      Less is More仮説.
    • Herbert, Jaeger, An Introduction to Dynamic Symbol Systems, in Proceedings of the AISB-95, pp. 109-120, 1995.
      dynamic symbols, formal symbols.
    • Jeffrey L. Elman, Elizabeth A. Bates, Mark H. Johnson, Annette Karmiloff‐Smith, Domenico Parisi, Kim Plunkett, 認知発達と生得性, 共立出版, 1998.
    • 川人光男, 銅谷賢治, 春野雅彦, 言語に迫るための条件, 科学, Vol. 70, No. 5, 2000.
      Pinkerが``言語器官''と呼んだ脳の領域は, 言語という機能に固有のものではないことが実験により判明. 『... シンボルが先験的な表象として存在しない神経回路に, それが身体や外界や他の個体との相互作用をした結果, シンボルが,ハードウェアとして, もしくは力学系のアトラクターの分節化として出現するというシナリオである』 (本文より引用)
    • 大森隆司, 脳におけるシンボル表現と語意獲得, Computer Today, 2000.3, No. 96, pp. 14-19, 2000.
    • 語意学習バイアス
      • 今井むつみ, 針生悦子, レキシコンの獲得における制約の役割とその性質, 人工知能学会誌, Vol. 18, No. 1, pp. 31-40, 2003.
      • 今井むつみ, 言語獲得におけるシンボルグラウンディング, 人工知能学会誌, Vol. 18, No. 5, pp. 580-585, 2003.
  • 語の特徴量
    • 久光徹, 丹羽芳樹, 辻井潤一, タームのrepresentativenessを測る, 情処研究会報告, 1999-NL-133-16, 1999.
    • 相澤彰子, 語と文書の共起に基づく特徴度の数量的表現について, 情処論文誌 Vol. 41, No. 12, pp. 3332-3343, 2000.
    • 武田善行, 梅村恭司, キーワード抽出を実現する文書頻度分析, 計量言語学, Vol. 23, No. 2, pp. 27-32, 2001.
    • 中川裕志, 森辰則, 湯本紘彰, 出現頻度と連接頻度に基づく専門用語抽出, 自然言語処理, Vol. 10, No. 1, pp. 27-45, 2003.
      MC-Value. 専門用語自動抽出システム TermExt, TermExtract. 固有表現
  • 共起, 語の関連性
    • Ted E. Dunning, Accurate Methods for the Statistics of Surprise and Coincidence, Computational Linguistics, Vol. 19, No. 1, pp. 61-74, 1993.
      G-score(log likelihood), χ2. G-scoreは正規分布を仮定していない.
    • Hwee Tou Ng, Wei Boon Goh, and Kok Leong Low, Feature selection, perceptron learning, and a usability case study for text categorization, in Proceedings of the 20th ACM International Conference on Research and Development in Information Retrieval (SIGIR-97), pp. 67-73, 1997.
      Correlation coefficient = sqrt(χ2).
    • 丹羽芳樹, 動的な共起解析を用いた対話的文書検索支援, 情処研究会報告 96-NL-115, pp.99-106, 1996.
    • 相澤彰子, 影浦峡, 著者キーワード中での共起に基づく専門用語間の関連度計算法, 信学会論文誌 Vol. J83-D-I, No. 11, pp. 1154-1162, Nov, 2000.
      共起関係をグラフ化し平均経路長で語間の距離を定義. 数量化VI類的手法で視覚化.
    • KeyGraph
      Yukio Ohsawa, Nels E. Benson and Masahiko Yachida, KeyGraph: Automatic Indexing by Co-occurrence Graph based on Building Construction Metaphor, Proceedings of the Advances in Digital Libraries Conference, IEEE, 1998.
      土台: 高頻度語を共起関係でリンクした時, 各ノードが multiply connected になっているサブグラフ.
      屋根: 土台たちに強い力で支えられつつ,文書を統合する語.
      柱: 屋根と土台を結ぶもの(関係).
      キーワード: 多くの強い柱で支えられる屋根と,それを支える土台.
    • Yutaka Matsuo, Yukio Ohsawa, and Mitsuru Ishizuka, A Document as a Small World, in Proceedings of JSAI 2001, LNAI 2253, pp. 444-448, Springer-Verlag, 2001.
      文書中の語をノード, 共起(同一文中)関係をリンクとするグラフはsmall world network. パス長の平均を小さくするのに貢献している語は, その文書にとって重要な語である. パス長の変化を見た方がbetweennessなどを使うより良い結果が得られる.
    • 松尾豊, 大澤幸生, 石塚満, Small World構造に基づく文書からのキーワード抽出, 情報処理学会論文誌,Vol.43, No.6, pp.1825-1833, 2002.
    • 松尾豊, 石塚満, 語の共起の統計情報に基づく文書からのキーワード抽出アルゴリズム, 人工知能学会論文誌, Vol.17, No.3, pp.217-223, 2002.
      コーパスを使わずに(1つの)文書からキーワードを抽出する. Gを高頻度出現語の集合としたとき, G∋gの出現と,語wとgとの共起の独立性をχ2検定で調べる. GはKeyGraphの土台に対応する.
    • Ramon Ferrer i Cancho and Ricard V. Solé, The small world of human language, Proceedings of the Royal Society, Series B, Vol. 268, No. 1482, pp. 2261-2266, 2001.
      要素数460,902のWord Web(語の共起のネットワーク)の平均経路長は2.67, クラスタ係数は 0.437, 次数分布は2つのベキ分布を合成したもの.
    • S. N. Dorogovtsev and J. F. F. Mendes, Language as an evolving word web, in Proceedings of The Royal Society of London, Series B, Biological Sciences, Vol. 268, No. 1485, pp. 2603-2606, 2001.
      Word Webの高次数部分は言語の時間発展に依存しないkernel lexicon
    • Ricard V. Solé, Bernat Corominas Murtra, Sergi Valverde, Luc Steels, Language Networks: Their Structure, Function and Evolution, Santa Fe Institute Working Paper, 05-12-042, 2005.
    • complex network
  • 固有表現
    • Roman Yangarber, Winston Lin, Ralph Grishman, Unsupervised Learning of Generalized Names, In Proceedings of the 19th International Conference on Computational Linguistics (COLING 2002), 2002.
      generalized names: 病名やウィルスの名前など.
    • 関根聡, 固有表現から専門用語, 言語処理学会 第10回年次大会(NLP2004) 「固有表現と専門用語」ワークショップ, 2004.
    • 椎名宏徳, 李龍, 上林弥彦, 地名の関連グラフを利用した地理情報検索, DEWS2004 4-B-04, 2004.
  • 語彙の連鎖,連想,類似性,アナロジー
    • 杉原厚吉, 伊理正夫, 2部グラフの分割理論を利用した概念構造決定法, オペレーションズ・リサーチ, Vol. 23, No. 8, pp. 504-510, 1978.
      『意味の抽出とは言葉の“使われ方”のデータを客観的に整理すること』 (S.I. ハヤカワ, 思考と行動における言語, 岩波書店, 1965). 人は対象からある概念を抽出しその概念を表す記号(言葉)を選ぶ. 記号と対象の関係を示す2部グラフから概念間の関係を導く.
    • J.J.Moris and G.Hirst, Lexical cohesion computed by thesaural relations as an indicator of the structure of the text, Computational Linguistics, Vol. 17, No.1, pp. 21-48, 1991.
    • 小嶋英樹, 古郡延治, 単語の意味的な類似度の計算, 信学技報, AI92-100, pp. 81-88, 1993.
      辞書を, 見出し語の意味が他の見出し語によって記述される言い換え系と捉える. この言い換え関係を単語のネットワークとみなす. 単語間の類似性をその上での活性伝播によって計算する.
    • 前田晴美, 糀谷和人, 西田豊明, 既存の雑多な情報を統合するための連想構造の提案, 情報処理学会情報学基礎研究会 42-1, pp.1-8, July 1996.
      「連想」による雑多な情報のゆるやかな関連づけ. 近傍検索,活性伝播型連想検索. CM-2: 連想構造を用いた情報整理支援システム.
    • A. Takano, Y. Niwa, S. Nishioka, M. Iwayama, T. Hisamitsu, O. Imaichi, H. Sakurai, Associative Information Access Using DualNAVI, Kyoto International Conference on Digital Libraries 2000 (ICDL'00), pp.285-289, 2000.
    • PLSI

    • 著者推定
      • J. Tankard, The Literrary Detective, BYTE, Vol. 11, No. 2, pp. 231-238, 1986.
      • 村上征勝, 著者はだれか? 計量文献学への招待 1, 数学セミナー, 11月号, pp.55-59, 1988. (1989年3月号までの5回連載)
      • 松浦司, 金田康正, n-gram分布を用いた近代日本語小説文の著者推定 計量国語学, Vol.22, No.6, pp.225-238, 2000.
    • 竹田正幸, 福田智子, 類似歌を探せ デジタル国文学の新展開, 日経サイエンス, 2002年5月号, 2002.

    • 佐藤理史, 実例に基づく翻訳, 情報処理, Vol.33, No.6, pp. 673-681, 1992.
  • オントロジー
    • 概念(語彙)の明示的な記述・体系化.概念間の関係記述,共通性(合意). 3つのレベル. Level 1: 概念の切り出しと階層的な記述, Level 2: 意味定義を明示化,形式化,様々な関係の定義, Level 3: 構築されたモデルの実行に関わる計算論(タスクオントロジー)
    • 溝口研
      オントロジー解説 FAQ オントロジー vs 知識ベース,オントロジー vs Taxonomy.
    • 緒方研
    • 西田研
      岩爪道昭, 白神謙吾, 武田英明, 西田豊明, インターネットからの情報収集・分類・統合化のためのオントロジー獲得, 第10回人工知能学会全国大会 18-03, pp.553-556, 1996.
    • SHOE (Simple Hypertext Ontology Extensions)
    • Ontolingua at Stanford Univ.
    • Adam Farquhar, Richard Fikes, James Rice, The Ontolingua Server: a Tool for Collaborative Ontology Construction.
  • 表現
  • 自然言語と計算機言語

  • 多変量解析
    • 田中豊, 脇本和昌, 多変量統計解析法, 現代数学社, 1998.
    • チャーノフの顔グラフ (Chernoff faces)
      • Herman Chernoff, The use of faces to represent points in k-dimensional space graphically, Journal of the American Statistical Association, Vol. 68, pp. 361-368, 1973.
      • Clifford A. Pickover, Computers, Pattern, Chaos, and Beauty, St. Martin's Press, 1990. (高橋時市郎, 内藤昭三 訳, コンピュータ・カオス・フラクタル − 見えない世界のグラフィックス, 白揚社, 1993)
        Appendix Bにpseudocodeがある.
      • R -- チャーノフの顔グラフ by 青木繁伸
    • Leonard Kaufman, Peter J. Rousseeuw, Finding Groups in Data, Wiley-Interscience, 1990.
      silhouette coefficient, agglomerative coefficient, divisive coefficient, etc. (cf. inconsistency coefficient)
  • 統計
    • S. Kullback and R. A. Leibler, On information and sufficiency, Ann. Math. Statist., Vol. 22, pp. 79-86, 1951.
    • 検定
      • χ2検定
      • フィッシャーの直接確率検定 (Fisher's exact probability test)
      • マン・ホイットニーのU検定 (Mann-Whitney's U test)
      • ウィルコクソンの符号順位検定 (Wilcoxon test)
      • クラスカル・ワーリス検定 (Kruskal-Wallis test)
      • Kolgomorov-Smirnov (KS) test
    • 条件に適合した統計解析手法の選択ガイド
    • ツール
  • BLI (Bounded Locality Interval)
    • A. W. Madison, Characteristics of Program Localities, University Microfilms International, Ann Arbor, Mich., 1982.
      参照の局所性を測るためのメトリック. Henderson と Card がユーザによるウィンドウ利用の様子を解析するために使用.
  • 時系列解析
    • FFT (Fast Fourier Transform)
    • Rakesh Agrawal, Ramakrishnan Srikant, Mining Sequential Patterns, Eleventh International Conference on Data Engineering, pp. 3-14, 1995.
    • DFA (Detrended Fluctuation Analysis)
    • Segmentation algorithm
      Pedro Bernaola-Galván, Plamen Ch. Ivanov, Luís A. Nunes Amaral, H. Eugene Stanley, Scale Invariance in the Nonstationarity of Human Heart Rate, Physical Review Letters, Vol. 87, No. 16, 168105, 2001.
  • 機械学習
    • 分類器
      • naive Bayes
      • k-Nearest Neighbor
        • T. Cover and P. Hart, Nearest Neighbor Pattern Classification, IEEE Trans. on Information Theory, pp. 21-27, 1967.
      • 決定木
        • ID3
        • C4.5
      • 最大エントロピー法
      • SVM (Support Vector Machine)
        • Kernel Machines
        • 高須淳宏, Support Vector Machineによる分類, bit別冊: 発見科学とデータマイニング, 共立出版, 2000.
        • 前田英作, 痛快!サポートベクトルマシン, 情報処理, Vol. 42, No. 7, 2001.
        • Thorsten Joachims, Making large-Scale SVM Learning Practical, in Advances in Kernel Methods - Support Vector Learning, B. Schölkopf, C. Burges and A. Smola (eds.), MIT Press, 1999.
        • LIBSVM by Chih-Chung Chang and Chih-Jen Lin.
    • LAD (Logical Analysis of Data)
    • Andrew Kachites McCallum, Kamal Nigam, Jason Rennie, Kristie Seymore, Automating the Construction of Internet Portals with Machine Learning, Information Retrieval, Vol. 3, No. 2, pp. 127-163, 2000.
    • Rainbow
      A program that performs statistical text classification. Based on the Bow library.
    • WEBSOM
    • Weka Machine Learning Project at School of Computing and Mathematical Sciences, Univ. of Waikato
      • Weka: Machine Learning Software in Java
        Classification, regression, clustering, association rules, visualization.
      • Ian H. Witten, Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, 1999.
    • 永田昌明, 平博順, テキスト分類 −学習理論の「見本市」−, 情報処理, Vol 42, No. 1, 2001.
      文書分類= 文書の素性選択(頻度, 情報利得, χ二乗検定, LSI)+ 分類器(決定木, k-最近隣法, 最大エントロピー法, SVM, boosting) による学習. SVMとC4.5の比較. C4.5は文書の素性数を増やしていくと精度が下がるが, SVMでは過学習が起きることなく精度が向上していく.
    • Yiming Yang, Jan O. Pedersen, A comparative study on feature selection in text categorization, in Proceedings of the 14th International Conference on Machine Learning (ICML-97), pp. 412-420, 1997.
      機械学習による文書分類における特徴語選択の代表的な5つの方法である document frequency (DF), information gain (IG), mutual information (MI), χ2 test (CHI), term strength (TS)を比較. IGとCHIが最も効果的.IG, CHI, DFの間には強い相関があるので, 計算コストを下げたいときにはDFを使うとよい.
  • ICA (Independent Component Analysis)
    • 甘利俊一, 村田昇, 独立成分分析, サイエンス社, 2002.
    • Thomas Kolenda, Lars Kai Hansen, Sigurdur Sigurdsson, Independent Components in Text, Advances in Independent Component Analysis (M. Girolami ed.), Springer-Verlag, 2000.
    • Jan Larsen, Lars Kai Hansen, Anna Szymkowiak, Torben Christiansen and Thomas Kolenda, Webmining: Learning from the World Wide Web, Computational Statistics and Data Analysis, 2001.
    • Ella Bingham, Ata Kaban, Mark Girolami, Finding topics in dynamical text: application to chat line discussions, in Poster Proceedings of the 10th International World Wide Web Conference, 2001.
      Complexity pursuitを使って,chatのログからトピックを抽出.
    • Aapo Hyvärinen, Complexity Pursuit: Separating interesting components from time-series, Neural Computation, Vol. 13, No. 4, pp. 883-898, 2001.
      ICAやprojection pursuitでは(静的な)分布の``面白さ''(つまり, 正規分布からの離れ具合)に注目しているが, 時間的相関などは見ていない. complexity pursuitでは双方の要素を考慮し, Kolmogorov Complexityと同じように, 時系列がいかに短くコード化できるかで面白さを測る. ちなみに, 同じ分散(≠0)をもつ確率分布の中で正規分布はエントロピーが最大.
    • Research at Laboratory of Computer and Information Science of Helsinki University of Technology
  • データ・マイニング
    • Apriori
      • Rakesh Agrawal and Ramakrishnan Srikant, Fast Algorithms for Mining Association Rules, in Proceedings of the 20th International Conference on Very Large Data Bases, pp. 487-499, 1994.
      • Christian Borgelt, Rudolf Kruse, Induction of Association Rules: Apriori Implementation, in Proceedings of the 15th Conference on Computational Statistics, pp. 395-400, 2002.
      • Christian Borgelt, Apriori - find association rules/hyperedges with apriori algorithm.
    • interestingness
      • Avi Silberschatz, Alexander Tuzhilin, What Makes Patterns Interesting in Knowledge Discovery Systems, IEEE Trans. On Knowledge And Data Engineering, Vol. 8, No. 6, pp. 970-974, 1996.
      • Sigal Sahar, Interestingness via what is not interesting, in Proceedings of the 5th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 332-336, 1999.
    • 神嶌敏弘, データマイニング分野のクラスタリング手法(1) —クラスタリングを使ってみよう!— , 人工知能学会誌, Vol. 18, No. 1, 2003.
    • 特集 最新!データマイニング, 情報処理, Vol. 46, No. 1, 2005.
      • 有村博紀, 喜田拓也, データストリームのためのマイニング技術
      • 鈴木英之進, データスカッシング
      • 鷲尾隆, グラフベースデータマイニングの基礎と現状
      • 鹿島久嗣, カーネル法による構造データマイニング
      • 山西健司, 竹内純一, 丸山祐子, 統計的異常検出3手法
      • 工藤拓, 新保仁, 自然言語におけるマイニング技術の応用
      • 豊田正史, 喜連川優, 大規模Webアーカイブからのデータマイニング
    • 特集 ポストゲノム時代に高まるバイオ自然言語処理への期待: バイオ自然言語処理最新事情, 情報処理, Vol. 46, No. 2, 2005.
      • 中村桂子, 語る科学へ向けて — データ・知識・生命現象をつなぐ —, pp. 107-111.
    • Marti A. Hearst, Untangling Text Data Mining, in the 37th Annual Meeting of the Association for Computational Linguistics, 1999.
  • グラフ
    • D. Cvetkovic;, M. Doob, H. Sachs, Spectra of Graphs Academic Press, 1979.
    • Spectral clustering
    • 田中栄一, 構造をもつものの距離と類似度, 情処学会誌, Vol. 31, No. 9, pp. , 1990.
    • 上原隆平, グラフクラスとアルゴリズム, 電子情報通信学会誌, Vol. 88, No. 2, pp. 118-122, 2005.
    • 解析/可視化
      • T. Kamada and S. Kawai, An algorithm for drawing general undirected graphs, Information Processing Letters, Vol. 31, No. 1, pp. 7-15, 1989.
      • Thomas M. J. Fruchterman, Edward M. Reingold, Graph Drawing by Force-directed Placement, Software - Practice and Experience, Vol. 21, No. 11, pp. 1129-1164, 1991.
      • Otter
      • Pajek at Institute for Mathematics, Physics and Mechanics, University of Ljubljana, Slovenia.
        • Vladimir Batagelj, Andrej Mrvar, Matjaž Zaveršnik, Partitioning Approach to Visualization of Large Networks, in Proceedings of the 7th International Symposium on Graph Drawing (GD'99), LNCS 1731, pp. 90-97, Springer-Verlag, 1999.
        • Vladimir Batagelj, Andrej Mrvar, Pajek Program for Large Network Analysis, in M. Jünger, P. Mutzel (Eds.), Graph Drawing Software, pp. 77-103, Springer, 2003.
      • Bill Cheswick, Hal Burch, and Steve Branigan, Mapping and Visualizing the Internet, in Proceedings of 2000 USENIX Annual Technical Conference, pp. 1-12, 2000.
      • JUNG (Java Universal Network/Graph Framework) at School of Information & Computer Science, University of California, Irvine.
        • Scott White, Padhraic Smyth, Algorithms for Discovering Relative Importance In Graphs, in Proceedings of Ninth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2003.
      • LGL (Large Graph Layout)
        Opte ProjectInternetのmapを作るために使われている.
      • David Soen-Mun Chan, Khim Shiong Chua, Christopher Leckie, Ajeet Parhar, Visualisation of power-law network topologies, in Proceedings of the 11th IEEE International Conference on Networks (ICON2003), pp. 69-74, 2003.
        Power-Law networkを効率良く描くアルゴリズムODLの提案. レギュラーネットワークとBGPのASマップを複数のアルゴリズム (ODL, Fruchterman-Reingold, Walshaw, ISOM, Kamada-Kawai) で描画し,対称性とクラスタ性が適切に表現されているかを比較. 対称性の点では ODL, Fruchterman-Reingold, Kamada-Kawaiがよく, クラスタ性の点では ODL, Fruchterman-Reingold がよい. 総合すると,見栄えの点では Fruchterman-Reingold が一番.
      • Andreas Noack An Energy Model for Visual Graph Clustering, Graph Drawing 2003, pp. 425-436, 2003.
        LinLogアルゴリズム. Fruchterman-Reingold などよりもクラスタどうしの分離性を高めて配置できる.
      • WebGraph
      • aiSee
      • tulip
      • 山田武士, 斉藤和己, 上田修功, クロスエントロピー最小化に基づくネットワークデータの埋め込み, 情報処理学会論文誌, Vol.44, No.9, pp. 2401-2408, 2003.
      • Graph Drawing category in Google Directory
    • complex network
    • social network
  • 計算幾何
  • グレイコード
    • 立木秀樹, 実数の表現とグレイコード, 数理科学, No.437, pp. 26-33, Nov. 1999.
      2進法では 0, 1, 10, 11 と表記される数が, グレイコードでは 0, 1, 11, 10 となる. 値が1つ異なる数どうしで表記が1文字しか変化しない.

  • 多様性と結び付き
    • Don R. Swanson, Undiscovered public knowledge, Library Quarterly, 56 pp. 103-118, 1986.
      2つの知識が結び付けば新しい発見を生む可能性があるにもかかわらず, それぞれ個別のコミュニティ(専門領域)の中でのみやりとりされ, 両方の知識を持つ人がいないという状況.
    • Don R. Swanson, Fish oil, Raynaud's syndrome and undiscovered public knowlege, Perspectives in Biology and Medicine, 30(1), pp. 7-18, 1986.
      undiscovered public knowledgeの例として, レイノー症候群と魚油(予防に効果がある)のケースを紹介.
    • B. Huberman, T. Hogg, The Behavior of Computational Ecologies, in Huberman, B., ed., The Ecology of Computation, pp. 77-115, North-Holland, 1988.
      グループによる科学研究などでは, 個々人のものの見方の多様性が発見の確率を向上させる.
    • Lee Fleming, Perfecting Cross-Pollination, Harvard Business Review, Vol. 82, No. 9, pp. 22-24, 2004.
      知的生産活動のためのチームにおけるメンバの多様性の効果. メンバの専門分野が類似している場合と多様性に富んでいる場合とを 得られた成果の(イノベーションとしての)価値で比較すると, 平均では前者が後者に優るが, 突出した成果(いわゆるブレークスルー)が得らるという点では後者が優れている.
  • GroupLens at University of Minnesota
    • Paul Resnick, Neophytos Iacovou, Mitesh Suchak, Peter Bergstrom and John Riedl, GroupLens: An Open Architecture for Collaborative Filtering of Netnews, in Proceedings of ACM 1994 Conference on Computer Supported Cooperative Work, pp. 175-186, 1994.
  • Social filtering
    • Upendra Shardanand and Pattie Maes, Social Information Filtering: Algorithms for Automating ``Word of Mouth'', Proceedings of ACM Conference on Human Factors in Computing Systems, pp. 210-217, 1995.
    • Henry Kautz, Bart Selman, and Mehul Shah, Referral Web: Combining Social Networks and Collaborative Filtering, Communications of the ACM, Vol. 40, No. 3, pp. 63-65, 1997.
  • Recommender Systems
    • Paul Resnick and Hal R. Varian, Recommender Systems, CACM Volume 40 , No. 3, pp. 56-58, 1997.
    • Pattie Maes, Robert H. Guttman and Alexandros G. Moukas, Agents that Buy and Sell: Transforming Commerce as we Know It, Communication of the ACM, Vol.42, No.3, pp. 81-91, 1999.
  • ネットワークコミュニティ
    • 梅木秀雄, ネットワークコミュニティ形成支援技術, 人工知能学会誌 Vol. 14, No. 6, pp. 943-950, 1999.
      明示的コミュニティ, 暗示的コミュニティ. LOUIS.
  • ソーシャルインタラクション
    • 植田一博, コミュニケーションを軸とした新しいシステム知のあり方, 「特集:ソーシャルインタラクション」, 情処学会誌, Vol. 40, No. 6, 1999.
      グループによる単純な問題解決作業のパフォーマンスは, 平均を上回っても最良の個人には及ばない. 創発性が期待されるような場面でこそ協調作業の意義がある.
  • CMC (Computer Mediated Communication)
    • 松村真宏, 三浦麻子, 柴内康文, 大澤幸生, 石塚満, 2ちゃんねるが盛り上がるダイナミズム, 情報処理学会論文誌, Vol.45, No.3, pp. 1053-1061, 2004.
    • Blog

Human Factor
  • Weber-Fechner(ウェーバー・フェヒナー)の法則
  • John R. Anderson ad L. J. Schooler, Reflections of the Environment in Memory, Psychological Science, 2(6), pp. 396-408, 1991.
    人間の記憶の特性はベキ法則に従う. また,ある種の environmental source(新聞の見出し語など)にも同様な 特徴が見られる.
  • J. Shrager and T. Hogg and B. A. Huberman, A Graph-Dynamic Model of the Power Law of Practice and the Problem-Solving Fan-Effect, Science, Vol. 242, No. 4877, pp. 414-416, 1998.
  • 不正確な記憶に対する構成的処理
    • E. F. Loftus, D. G. Miller, and H. J. Burns, Semantic integration of verbal information into a visual memory, Journal of Experimental Psychology: Human Learning and Memory, 4, pp. 19-31, 1978.
    • 村上晴美, 日本語の歌詞の長期記憶における構成的処理 −「蛍の光」と「仰げば尊し」を題材として, The Second International Conference on Cognitive Science and The 16th Annual Meeting of the Japanese Cognitive Science Society Joint Conference (ICCS/JCSS99), pp.842-845, Tokyo, Japan, 1999.
  • Fan Effect
    • J. R. Anderson, Retrieval of propositional information from long-term memory, Cognitive Psychology, 6, 451-474, 1974.
    • J. R. Anderson, A spreading activation theory of memory, Journal of Verbal Learning and Verbal Behavior, Vol. 22, pp. 261-295, 1983.
    • ある概念について多く学ぶ(記憶する)ほど,その概念に関する事柄を 記憶から引き出すのに時間がかかるという現象. Andersonは, この現象を説明するACT(Adaptive Control of Thought)というモデルを提唱. 関連する記憶(されている事柄)が互いに継りネットワークを形成する. 記憶は使われることに活性化される.その活性は伝搬され継りが強化される. 多くの記憶が継っていると活性が分散してしまい, その結果fan effectが起きる.
  • Theories and Hypotheses Related to Integrated Cognitive Architectures
  • D. Austin Henderson, JR., and Stuart K. Card, Rooms: The Use of Multiple Virtual Workspace to Reduce Space Contention in Window-Based Graphical User Interface, ACM Transaction on Graphics, Vol.5, No.3, July 1986, pp. 211-243.
    Window Thrashing. ウィンドウシステムでのウィンドウの使われ方 (使用頻度,使用ウィンドウ数)の解析. ウィンドウの利用に局所性がみられる.
  • 連言の錯誤 (Conjunction Fallacy)
    • Amos Tversky and Daniel Kahneman, Judgments of and by representatitveness, in ``Judgment under uncertainty: Heuristics and biases,'' Daniel Kahneman, Paul Slovic and Amos Tversky (Eds.), Cambridge University Press, Cambridge, UK, pp. 84-98, 1982.
      「リンダは31才の独身の女性で活発で非常に聡明である.大学の専門は哲学だった. 学生の時に彼女は差別問題や社会的不公平の問題に真摯に取り組み, 反核デモにも参加した」という記述を見せたあとで, 次のそれぞれが当てはまる確率はどれくらいかを判断させるという課題を出す.
       (a) リンダは小学校の先生になった
       (b) リンダは本屋に勤めていて,ヨガのレッスンを受けている
       (c) リンダはフェミニスト運動に関わっている
       (d) リンダは神経症の分野のソーシャルワーカーである
       (e) リンダは婦人参政権の会のメンバーである
       (f) リンダは銀行の窓口で働いている
       (g) リンダは保険の外交員である
       (h) リンダは銀行の窓口で働いていて,フェミニスト運動にも関わっている
      このとき、(h) = (c) AND (f) なのにもかかわらず、 一般に人は、 (c) > (h) > (f) のように確率を判断してしまう。
  • 楠見孝, 類似性と近接性 − 人間の認知の特徴について, 人工知能学会誌, Vol. 17, No. 1, 2002.
  • アフォーダンス (J.J.Gibson)
    • 環境が行動を誘発する. 行為に伴って環境から引き出される行為の可能性. 知覚とは行為を囲む状況の生成であり,行為とは切り離せない.
  • 松原仁, 身体性の意味するところ, bit別冊: 身体性とコンピュータ, 共立出版, 2000.
    情報処理の対象を適当に狭める「手抜き」(情報の部分性) が人間の知能を支えており,これにより人間はフレーム問題を回避している. そして,情報の部分性は身体性に起因する.
  • 脳の情報処理
    • 時間コーディング (temporal coding)
      • W. J. Freeman によるウサギの嗅球における活動パタンの解析
        (ある時点での空間的)活動パタンは 外部情報(臭い)をそのままコード化したものではなく, 刺激提示の履歴に依存したものである.
    • カオス的遍歴 (津田一郎)

User Interface,視覚化
  • George W. Furnas, Effective View Navigation, Proceedings of ACM CHI 97 Conference on Human Factors in Computing Systems, Vol. 1, pp.367-374, 1997.
    Efficient View Traversability (EVT).
    View Navigability (VN); residue & scent for improving VN.
    Effective View Navigability (EVN) = EVT + VN.
  • Zooming Interface
    • Pad++
    • Jazz
      A successor to Pad++ implemented in Java.
    • HishiMochi
      豊田正史, 柴山悦哉, ズーミング技術を用いた対話的情報検索インタフェース, bit別冊: 発見科学とデータマイニング, 2000.
  • A. Spoerri, Visual Tools for Information Retrieval, Proc.of 1993 IEEE Symposium on Visual Languages (VL'93), pp. 160-168, 1993
    InfoCrystal. Venn図を応用した情報検索支援.
  • 梛野憲克, 山田誠二, マルチ Web ロボットによるユーザの興味を反映した情報収集, 電子情報通信学会論文誌, Vol. J83-D-I, No.7, pp. 780-788, July 2000.
  • Robert R. Korfhage, To see or not to see -- is that the query?, Conference on Research and Development in Information Retrieval, pp. 134-141. ACM, ACM Press, October 1991.
    VIVE (search by direct keyword manipulation).
  • 舘村純一, DocSpace:文献空間のインタラクティブ視覚化, WISS'96, 1996.
  • 渡邊恵太, 安村通晃, Memorium: 眺めるインタフェースの提案とその試作, 第10回 インタラクティブシステムとソフトウェアに関するワークショップ(WISS2002)論文集, pp.99-104, 2002.
    有限寿命のカードが画面を浮遊. カードどうしが衝突すると,それらのタイトルをもとにAND検索が行われ新しいカードが生成される.
  • グラフ構造の可視化
  • User Interface Research Group at Xerox Parc
    • Historic Perspective on Visualizing the Interactions of Web Ecologies
    • WebBook and WebForager
  • Information Visualization at PNNL (Pacific Northwest National Laboratory)
  • 増井俊之, 視覚化関連文献
  • Rika Furuhata, Issei Fujishiro, Kana Maekawa, Yumi Yamashita, Applications of Information Visualizaitons (MIKY database: Information Visualization and Visualization Techniques)

  • Social network
    • Stanley Wasserman, Katherine Faust, Social Network Analysis: Methods and Applications, Cambridge Univ. Press, 1994.
    • 平松闊 (編著), 社会ネットワーク, 福村出版, 1990.
      友人/交際/親族のネットワーク,勢力,クリーク,点中心性. 同類指向(inbreeding).
    • Small World
      • Stanley Milgram, Small World Problem, Psychology Today, 1, pp. 60-67.
      • P. S. Dodds, R. Muhamad, D. J. Watts, An experimental study of search in global social networks, Science, 301, pp. 827-829, 2003.
    • 弱い紐帯(weak-tie)
      • Mark S. Granovetter, The strength of weak ties, American Journal of Sociology, Vol. 68, pp. 1360-1380, 1973.
      • Mark S. Granovetter, Getting a Job, University of Chicago Press, 1974. (邦訳: 転職, ミネルヴァ書房, 1998.)
      • 渡辺深, 転職 −転職結果に及ぼすネットワークの効果−, 社会学評論, Vol. 42, No. 1, pp. 2-16, 1991.
      • 安田雪, 実践ネットワーク分析—関係を解く理論と技法, 新曜社, 2001.
        Granovetterの議論では,weaknessよりbridgeの概念が重要. bridgeとは,それが除かれてしまうとまとまりが壊れてしまう (1つだったグラフが複数のサブグラフに分かれてしまう)ような紐帯.
    • 中心性
      • Linton C. Freeman, Centrality in Social Networks: Conceptual Clarication, Social Networks, 1, pp. 215-239, 1979.
        Betweenness(媒介性), closeness.
    • complex network
  • 野島久雄, データベースとしてのWWW,データベースとしての社会, Computer Today, No. 84, pp. 60-67, 1998.
  • 噂,流行
    • 伊藤淳子, 女子高生のクチコミのつくりかた, 情報処理学会研究会報告, 1995-IM-25-6, pp. 41-47 , 1995.
      マスメディアによる情報伝搬は早いが根づかない(ブームが冷めるのも早い). 情報はそのまま放っておくと腐る. 魅力を保持するには変化させる(育てる≒生活に密着させる)必要がある. 小さなコミュニティには情報を育てる力がある.
    • 川上善郎, わさが走る—情報伝播の社会心理, セレクション社会心理学 (16), サイエンス社, 1997.
      マス・コミュニケーションよりパーソナル・コミュニケーションの方が ニュースをよく伝播することを実データをもって示している.
    • 佐藤達哉(編), 流言、うわさ、そして情報−うわさの研究集大成,  現代のエスプリ特集号, 至文堂, 1999.
    • うわさとニュースの研究会
    • Malcolm Gladwell, ティッピング・ポイント —いかにして「小さな変化」が「大きな変化」を生み出すか, 飛鳥新社, 2000.
         - コネクター, 通人(メイヴン), セールスマン
         - 150の法則, 交換記憶(トランザクティヴ・メモリ)
         - 導入者(イノヴェータ), 初期採用者, 初期多数派, 後期多数派, 出遅れ(ラガード)
    • Susan Blackmore, The Power of Memes, Scientific American, Vol. 283 No. 4, October 2000, p 52-61, 2000.
    • 河根拓文, 村重淳, 合原一幸, 2次元しきい値分布を利用した流行現象の数理モデルとその解析, 信学会論文誌 Vol.J83-A, No.3, pp.284-293 Mar., 2000.
    • 吉田匡志, 伊藤雄介, 沼尾 正行, 口コミによる分散型情報収集システム, 第10回マルチ・エージェントと協調計算ワークショップ (MACC2001), pp. 61-68, 2001.
    • 水谷直樹, 利用者の情報交換が新製品普及競争に与える影響, 信学会論文誌 Vol.J85-D-I, No.7, pp.582-591, Jul., 2002.
      人のつながり(強い紐帯 vs 弱い紐帯)と商品普及の関係. 弱い紐帯の方が独占状態になりやすい. ネットワークの外部性: 利用者数の増加により利便性が増すというような, 利用者側に規模の経済が働く性質. 地方は都市より強い紐帯を多くもつ.
  • 考現学
  • 組織
    • Michael Prietula, Kathleen Carley, and Les Gasser (Eds.), Simulating Organizations: Computational Models of Institutions and Groups, AAAI Press / MIT Press, 1998.
    • Alessandro Lomi, Erik R. Larsen, Dynamics of Organizations: Computational Modeling and Organization Theories, AAAI Press / MIT Press, 2001.
  • 遊び
    • ヨハン・ホイジンガ, ホモ・ルーデンス, 中央公論新社, 1973.
      遊びは文化よりも古い.人間は「遊ぶ人」である. 遊びとクラブは,あたかも頭と帽子の関係のようなもの.
    • ロジェ・カイヨワ, 遊びと人間, 講談社, 1990.

  • 創発
    • 北村新三 (編), 特集 創発システム −人工システムの新たなパラダイムをめざして−, 計測と制御, Vol. 35, No. 7, 計測自動制御学会, 1996.
  • 貨幣
    • Marcel Mauss, 贈与論, 1925, (邦訳: 社会学と人類学(I), 弘文堂, 1973 に収録).
    • 安富歩, 貨幣の複雑性, 創文社, 2000.
  • 形態形成
    • Hiroaki Kitano, Designing Neural Networks using Genetic Algorithm with Graph Generation System, Complex Systems, 4, pp. 461-476, 1990.
      GAによりニューラルネットを進化させる方法. 従来,ネットワークの構造を直接遺伝子にエンコードする ダイレクトエンコード法が使われていたのに対し, ネットワークの作り方をエンコードする文法エンコード法を提案. GAで「Lシステムの記述」を進化させ, そのLシステムを適用してネットワークを構成(発生メカニズムの応用). 多様性を増加させるための方法として「発生」は効果的. (参考: 北野宏明, 佐倉統, 人工生命というシステム, ジャストシステム, 1995.)
    • 西田泰伸, Lシステム,歴史と展望, 信学会論文誌 Vol.J84-D-I No.1 pp.18-30, 2001.
  • Swarm Intelligence
    • Ant Colony Optimization
    • Guy Theraulaz, Jacques Gautrais, Scott Camazine, Jean-Louis Deneubourg, The formation of spatial patterns in social insects: from simple behaviours to complex structures, Philosophical Transactions of the Royal Society of London A, Vol. 361, pp. 1263-1282, 2003.
  • Radom / Complex Network
    • Duncan J. Watts and Steven H. Strogatz, Collective dynamics of 'small-world' networks, Nature, No. 393, pp. 440-442, 1998.
    • Duncan J. Watts, Small Worlds: The Dynamics of Networks between Order and Randomness, Princeton University Press, 1999.
    • Albert-László Barabási, Réka Albert, Emergence of scaling in random networks, Science, No. 286, pp. 509-512, 1999.
      リンクの次数が冪分布になっていることを ``preferential attachiment''で説明.
    • Albert-Laszlo Barabasi, Linked: The New Science of Networks, Perseus Publishing, 2002.
    • Illés J. Farkas, Imre Derényi, Albert-László Barabási, Tamás Vicsek, Spectra of ``Real-World'' Graphs: Beyond the Semi-Circle Law, Phys. Rev. E 64, 026704, 2001.
    • M. E. J. Newman, Who is the Best Connected Scientist? A Study of Scientific Coauthorship Networks, Phys. Rev. E, 016131, 2001.
      connectedness (e.g., closeness, betweenness) で共著関係を測る.
    • M. Girvan, M. E. J. Newman, Community structure in social and biological networks, Proc. Natl. Acad. Sci. USA, Vol. 99, No. 12, pp. 7821-7826, 2002.
      関係を表すグラフをリンクの``betweenness''に基づいて分割し, コミュニティを抽出する. ただし計算量はO(n3).
    • Stefano Mossa, Marc Barthélémy, H. Eugene Stanley, Luís A. Nunes Amaral, Truncation of Power Law Behavior in "Scale-Free" Network Models due to Information Filtering, Vol. 88, No. 13, 138701, 2002.
      preferential attachimentの対象を制限することにより, 入リンクの次数分布にcut-offが生じる.
    • Mark Buchanan, Nexus: Small Worlds and the Groundbreaking Theory of Networks W.W. Norton & Company
    • S. N. Dorogovtsev, J. F. F. Mendes, Evolution of Networks: From Biological Nets to the Internet and WWW, Oxford Univ. Press, 2003.
    • Duncan J. Watts, Six Degrees: The Science of a Connected Age, W.W. Norton & Company, 2003.
    • Massimo Marchiori, Vito Latora, Harmony in the Small-World, Physica A, 285, 539-546, 2000.
    • Nisha Mathias and Venkatesh Gopal, Small Worlds: How and Why, Phys. Rev. E, 63, 21117, 2001.
    • M. Gitterman, Small-World Phenomena in Physics: The Ising Model, J. Phys. A 33, 8373-8381, 2000.
    • S. N. Dorogovtsev, A. V. Goltsev, J. F. F. Mendes, Pseudofractal Scale-free Web, Phys. Rev. E 65, 066122, 1-4 2002.
      2点をつなぐ1辺から出発し, 1ステップごとに各辺に1つの点を追加(辺の端にある2点と追加する点をつないで三角形をつくる)して pseudofractal networkを構成. 各点の次数とクラスタ係数は反比例する(よってクラスタ係数の分布もベキ).
    • Erzsébet Ravasz, Albert-László Barabási, Hierarchical organization in complex networks, Physical Review E 67, 026112, 2003.
      Hierarchical network model. 階層構造は次数とクラスタ係数の反比例によって特徴付けられる.
    • Alexei Vázquez, Growing network with local rules: Preferential attachment, clustering hierarchy, and degree correlations, Phys. Rev. E 67, 056104, 2003.
      Connecting nearest neighbor model.
    • M. E. J. Newman, The Structure and Function of Complex Networks, SIAM Review, Vol. 45, No. 2, pp. 167-256, 2003.
    • Ricard V. Solé, Ramon Ferrer-Cancho, Jose M. Montoya, Sergi Valverde, Selection, Tinkering, and Emergence in Complex Networks, Complexity, Vol. 8, No. 1, 2003.
    • M. E. J. Newman, Finding and evaluating community structure in networks, Physical Review E 69, 026113, 2004.
      複数の方法により測ったbetweennessに基づくクラスタリングの比較. クラスタリングの適切さを測るmodularityを提案.
    • M. E. J. Newman, Fast algorithm for detecting community structure in networks, Physical Review E 69, 066133, 2004.
      いわゆるbetweenness clusteringがエッジを順次取り除いていくのとは逆に, modularityを向上させるようにノード同士をつなげていく. 計算量は疎なグラフではO(n2).
    • The WIENER Project
      WIENER = "Word Interactions: Exploring NEtwork Robustness". 共起ネットワーク解析のための各国語コーパスなどへのリンクがある.
    • social network
    • Webの構造
  • 複雑さ,乱雑さ
    • エントロピー,数理科学別冊, サイエンス社, 1992.
    • Remo Badii, Antonio Politi, Complexity : Hierarchical Structures and Scaling in Physics, Cambridge University Press, 1997. (相澤洋二 監訳, 複雑さの数理, 産業図書, 2001)
    • Avi Wigderson, The Complexity of Graph Connectivity, in Proc. of the 17th Mathematical Foundations of Computer Science conference, Havel and Koubek (Eds.), LNCS 629, pp. 112-132, 1992.
    • James P. Crutchfield, The Calculi of Emergence: Computation Dynamics, and Induction, SFI Working Paper, 94-03-016, 1994. (Physica D, 75, pp.11-54, 1994)
      deterministic complexityとstatistical complexity. 前者はrandomnessの増加に従い単調増加するが, 後者は規則性のあるもの(e.g., periodic process)と ランダムなものの中間で最大となる.
    • 時田恵一郎, 複雑さの起源 −“拡張された工学”の視座へ−, 高温学会誌, Vol. 28, No. 6, pp. 309-314, 2002.
  • 確率モデル
    • 今野紀雄, 確率モデルって何だろう, ダイヤモンド社, 1995.
    • 小田垣孝, つながりの科学 — パーコレーション —, 裳華房, 2000.
  • 相転移
    • K.Fukuda, H.Takayasu, and M.Takayasu, Observation of Phase Transition Behavior in Internet Traffic, Advances in Performance Analysis, Vol. 2 No. 1, pp.45-66, 1999.
    • V. Plerou, P. Gopikrishnan, H. E. Stanley, Two-Phase Behavior of Financial Markets, Nature Vol. 421, No. 130, 2003.
  • フラクタル
    • 高安秀樹, フラクタル, 朝倉書店, 1986.
    • 福田健介, ネットワークトラフィックの自己相似性とその生成モデル, 情報処理, Vol. 45, No. 6, pp. 603-609, 2004.
      非輻輳相, 臨界点, 輻輳相という3つのトラフィックの状態のうち, 臨界点で自己相似性が出現. 自己相似性を生む要因として, 非線型なバッファI/Oと通信者間の相互作用がある.
  • 1/f ゆらぎ
    • 武者利光, ゆらぎの世界, ブルーバックス B442, 講談社, 1980.
      アラン分散: 一般に,時系列の時間間隔Tあたり平均値にはばらつきがある. この分散をTの関数と考えたものがアラン分散. ランダム事象では,Tが大きくなるにつれアラン分散は小さくなる. 1/f ゆらぎのアラン分散はTによらず一定. 一方,1/f2 ゆらぎではTの平方根に比例して増大する.
    • Marvin S. Keshner, 1/f Noise, Proceedings of the IEEE, Vol. 70, No. 3, pp. 212-218, 1982.
    • M. Kobayashi, T. Musha, 1/f fluctuation of heartbeat period, IEEE. Trans. Biomed. Eng. BE-29, pp. 456-457, 1982.
    • Ricard V. Solé, Susanna C. Manrubia, Michael Benton, Per Bak, Self-similarity of extinction statistics in the fossil record, Nature, Vol. 388, No. 6644, pp. 764-767, 1997.
      アンモナイトの種数の変動は1/fゆらぎを示す. 種の分化と絶滅のダイナミクスには自己相似性が認められる.
    • P. C. Ivanov, L. A. N. Amaral, A. L. Goldberger, S. Havlin, M. G. Rosenblum, H. E. Stanley, Struzik, Z. R, From 1/f noise to multifractal cascades in heartbeat dynamics, Chaos, Vol. 11, No. 3, pp. 641- 652, 2001.
    • A. L. Goldberger, L. A. N. Amaral, J. M. Hausdorff, P. C. Ivanov, C. K. Peng, H. E. Stanley, Fractal dynamics in physiology: Alterations with disease and aging, PNAS, Vol. 99 Suppl. 1, pp. 2466-2472, 2002.
    • Wentian Li, Pubs on one-over-f (1/f) noise.
    • Ken'ichi Fukamachi, 1/f Fluctuations in Internet Communication, Interdisciplinary Information Sciences, vol.1, 157, 1995.
    • ライフゲームにおける1/fゆらぎ
      • Per Bak, Kan Chen, and Michael Creutz, Self-organized criticality in the `Game of Life', Nature, Vol. 342, Dec. 1989.
      • Shigeru Ninagawa, Masaaki Yoneda, Sadaki Hirose, 1/f fluctuation in the ``Game of Life'', Physica D, 118, pp. 49-52, 1998.
      • 蜷川 繁, ライフゲームにおける1/fゆらぎと過渡状態, 情報処理学会論文誌, Vol.43, No.6, pp. 2017-2020, 2002.
    • 武者利光, ゆらぎ現象研究会 (編), ゆらぎの科学1〜10, 森北出版, 1991-1999.
    • 飛田武幸, 高安秀樹, 公文俊平(対談), ゆらぎで世界を解析する at GLOCOM 智場
    • Rika Soma, Daichi Nozaki, Shin Kwak, Yoshiharu Yamamoto, 1/f nose outperforms white noise in sensitizing baroreflex function in the human brain, Physical Review Letters, Vol. 91, No. 7, 078101, 2003.
  • 冪分布, Zipfの法則
  • 情報統計力学
    • 篠本滋, 情報の統計力学, 丸善, 1992.
    • 西森秀稔, スピングラス理論と情報統計力学, 岩波書店, 1999.
    • 樺島祥介, 田中利幸, 統計力学と情報処理 信学会誌, Vol. 83, No. 8, pp. 630-636, Aug. 2000.
  • Econophysics
  • 蜷川繁, 広瀬貞樹, 長谷博行, 米田政明, スペクトル解析による1次元セルオートマトンの分類, 信学会論文誌 Vol.J80-D-I No.11 pp.856-865, 1997.
  • 轡田康, 広瀬貞樹, 蜷川繁, 木村春彦, セルオートマトンを用いた雪の結晶の類似パターン生成, 信学会論文誌 Vol. J83-D-I, No. 9, pp. 909-918, Sep., 2000.
  • 増田直紀, 合原一幸, 状態離散化カオス写像のエルゴード性,カオス性,及びフラクタル構造, 信学技報 Vol.100, No.204, NLP2000-53, pp.39-53, July, 2000.


© 2002-2004. Compiled and Annotated by Shin-ya Sato