探索・推論の時期に、知識や経験の構築で探索コストを削減できて、精度も上げるし、実用性の可能性も出てきた。
そのため、知識のデータベースを構築する必要も出てきた。
膨大なデータベースがあれば、ある程度の範囲内の問題をコンピューターに質問して、答えが出てくるシステムが開発された。特に会話をシミュレーションするシステム。例えば、イライザ(ELIZA)というプログラムは自然な感じで人間と対話を行える。
ただ、コンピューターが会話の本当の意味を理解できるわけではなく、パターンに応じて答えを出すだけ。このようなプログラムは人工無脳プログラムと呼ばれる。
イライザ効果
人工無脳のプログラムと会話している時に、本物の人間と会話しているような錯覚。
専門家の知識も蓄積できたら、どうなる?専門家みたいなシステム(エキスパートシステム)を作るも可能になるでしょう。
スタンフォード大学で開発した未知の有機化合物を特定するエキスパートシステム。
同じくスタンフォード大学で開発した血液中のバクテリアを診断し、処方するまでできるエキスパートシステム。
問題を解決するため、知識を整理方法、処理方法などの研究を行っている。その中に意味ネットワークとオントロジーがある。
人間の記憶構成の一種を表すためのモデル。概念を表すノート、意味関係の矢印で構成したネットワーク。
○: 意味ネットワークの効果は、人間にとってわかりやすい、関連する知識の検索をしやすい。
✖️: 意味ネットワークは関係を表現するのが良いだが、記述の決まりはないので、共有するのはできない。
オントロシーは「概念化の明示的な仕様」という定義がある。目的は知識の共有と活用。
記述を統一しないと、色んな言葉での記述が出てくるので、共有と活用のハードルが高くなる。そのため、統一した記述で行う研究を進んでいる。その中に、全ての一般常識を蓄積するCycプロジェクトは1984年からスタートされた。セマンティックWeb、Linked Open Dataという研究も展開されている。
場合によって、オントロジーはヘビーウェイトオントロシーとライトウェイトオントロシーがある。
ヘビーウェイトオントロシー
この場合だと記述の正当性の考察が必要のため、時間がかかる。Cycプロジェクトが30年以上経って未だに終わっていない。
ライトウェイトオントロシー
使える程度で良い場合なので、厳密に正当性の考察をする必要はあまりない。ウェブマイニング、データマイニングで利用されている。