活用・評価を促進する知識システムの要件の研究

山口琢*†1 小林龍生†2 大場みち子†3 野口尚孝†1

†1株式会社ジャストシステム
†2ジャストシステムデジタル文化研究所
†3日立製作所ソフトウェア事業部

概要

WebページやBlogに代表される現代の電子化された定性情報システムは、それらの発信・出版、配信・購読、発見といった情報の《流通》において、技術やビジネスモデルが発展してきた。しかし、これら定性情報の《利用》について、定量化・コード化された情報のそれと比べてみると、情報活用の密接さや、情報評価の精細さなどにおいて手薄であり、この部分の技術開発に知識《再利用》システム発展の鍵があると、我々は考えている。この課題に対して、我々は、試験実装を通して、知識《再利用》システムの要件を洗い出して検証するというアプローチをとる。現在、我々が考える要件とは、知識を使うことと知識自身への操作が表現されていること、知識の相互運用性があること、そして様々な知識を受容できることである。今回は、試験実装システムを通して、我々の取り組みを報告する。

キーワード知識, 再利用

Study on the requirements of a knowledge system which drives people to use and evaluate knowledge

YAMAGUCHI Taku†1 KOBAYASHI Tatsuo†2 OBA Michiko†2 NOGUCHI Hisataka†1

†1JustSystems Corporation
†2Justsystems Digital Culture Research Center
†3Hitachi, Ltd.

Abstract

This paper discusses the reuse of narrative documents such as Web pages and Blogs with some requirements for the system reusing them.

Keywordknowledge, reuse

作成 v1: 2008年6月16日(月)

改訂 v2d1: 2008年6月18日(水)

1. はじめに

WebページやBlogに代表される現代の電子化情報は記述的で定性的である。これらは、その発信・出版、配信・購読、発見といった情報の《流通》局面において、技術やビジネスモデルが発展してきた。しかし、これらの《利用》局面について、定量化・コード化された情報のそれと比べてみると、情報活用の密接さや、情報評価の精細さなどにおいて手薄であり、この部分の技術開発に知識《再利用》システム発展の鍵があると、我々は考えている。

われわれが設定した課題は、記述的文書、定性情報の新しい《読み》《書き》ツールの開拓である。人々が意識的・無意識的に行っているであろう読み方、書き方で、いまだシステム化されていないものを発見しツール化することが、そのような技術開発につながるであろう。

これらは、知識共有と関連している。《読み》方や《書き》方の一部を、人々の頭の中からICT環境に《外在化》し電子的な手段として実装すると、知識共有を促進するのではないかと考えている。

また、これらは発想支援と関連している。文書の《読み》《書き》ツールに試行錯誤や発散的・収束的な性質を組み入れることが有効ではないかと考えている。

この課題に対するわれわれのアプローチは「論より実装」。試験実装を通して、知識《再利用》システムの要件を洗い出して検証するというアプローチをとる。

この報告では、この過程で見えてきた、そのようなツールの特徴、満たすべき要件を論じる。

2. 知識とその利用

知識の分類

知識を分類することで、われわれの着眼点を示す。われわれが研究の対象としているWebページやBlogなどの電子化情報は、主に宣言的な知識である。また、暗黙的な過程や知識が重要である。

手続き的知識
作業に適用する知識。プラントの運転方法、など
宣言的知識
手続き的ではない知識。記述的知識。命題の形で表現される知識、など。

暗黙的な過程や知識とは、形式的と対にして、次のようなものである。

形式的
情報が文章や図表によって、明示的に説明・表現されているさま。
暗黙的

情報が文章や図表によって、明示的に説明・表現されていないさま。

  • 知識が文章や図表の背後、行間に置かれているさま。
  • 文章を記述するときに無意識に判断してしまうこと、または前提としてしまうこと、またはそのような知識。
  • 文章を読むときに無意識に読み取ってしまうこと、または採用してしまう観点、またはそのような知識。

ここで、文章や図表を記述する場合でも、あるいは提示された文章や図表を読む場合でも、そこに暗黙的な過程があり、その結果として文章や図表に埋め込まれ、あるいはそこから読み取ってしまう暗黙的な知識があることに、着目している。

宣言的で暗黙的な知識の特徴

このような知識の《読み》《書き》過程は、次のような特徴を持っている。

試行錯誤
文書を書くときも、読むときも試行錯誤する。試行錯誤を非効率で悪いこととは見なさず、むしろ肯定的に見る場合もある。
意味、真偽が未定、不定
知識の意味、価値、または真偽が未定または不定である。試行錯誤して書きながら、あるいは読みながら、これらが確定していく。

知識の利用

定性的な知識の利用をコンピューターシステムが支援すると言った場合、この《利用》の意味が、必ずしも明確ではないようだ。

他方で、定量情報、またはコード化された情報を利用する場合、利用にあたってコンピューターシステムが役に立っていることは比較的明確である。

例えば、数値地図を用いて、ある地点から富士山が見えるかどうかを判定できる。このとき、その数値地図を利用したと言えるであろう。

この利用において、コンピューター上の解析プログラムの効果は絶大である。数値地図だけが手元にあって、コンピューターシステムが使えない場合、この判定が行える人は、コンピューターシステムが使える場合に比べて極端に少ないであろう。検索エンジンを使って数値地図を見つけて手元に入手できるだけでは、数値地図を利用できたとは言わない。

一方、定性的な知識を手に入れてそれを何らかの判断に使ったときも、やはり、その知識を利用したと言えるであろう。その利用において、コンピューターシステムが、数値地図の場合と同様に役立つだろうか?

われわれが言うところの知識を利用するシステムとは、数値地図利用においてと同様に、知識利用において役に立つシステムのことである。検索システムは、知識を手元に入手する役に立つだけである。利用を促進するが、利用することそのものに役立つわけではない。

では、知識を利用するシステムとは、どのようなものであろうか?

宣言的な知識の利用

宣言的で暗黙的な知識は意味が未定であるということを、われわれの課題である、知識利用の観点から見てみよう。

手続き的知識の利用が何を意味するかは明確である。例えば、ICカード方式の乗車カードの利用手順は、電車に乗るために利用する。

宣言的知識も利用される。例えば、車高が189cmであるという知識を使って、入庫可能な車庫を探す。

しかし宣言的知識の利用は様々である。車のスペック表に、なぜ車高の欄があるのか?逆に、ある地域で、車のスペック表に車高欄がなかったら、その地域には道路をまたぐ橋も、トンネルも、立体駐車場も存在しないのではないか?などと、その地域の様子を推測するのに、車高欄の不在を利用するかもしれない。

3. 宣言的で暗黙的な知識を利用するシステムの要件

宣言的で暗黙的な知識の特徴を踏まえて、このような知識を利用するシステムの要件を、現在のところ表1のように整理している。

表1 宣言的で暗黙的な知識を利用するシステムの要件

 要件 《読み》《書き》の
試行錯誤
意味、真偽が
未定、不定
暗黙的
受容性 試行錯誤するので、最初から正しいとは言えない。また、間違っていることを示せること、わざと間違えることが可能、なども必要。 定量化・コード化にそぐわない。正しさを前提とできない。
利用すること、
または相互作用
試行錯誤は、しばしば知識同士の結合や突き合わせによって行われる。 他の知識との明示的な相互作用によって、暗黙的な知識に気づくことがある
変化を表現 試行錯誤は、しばしば知識自身が変容する過程である。どのような知識も変更可能であれば、様々な条件を疑い、試行錯誤が可能となる。

システム間の
相互運用性

知識のスコープが未定。または、分野をまたがって知識を利用する可能性を持ちたい。

ここで、各要件は次のような内容である:

受容性
あらゆる知識(の候補)を受け入れる。それが客観的でも主観的でも、整合的でも矛盾があっても、形式的でも暗黙的でも。
利用すること、または相互作用
知識を使うこと、または知識同士の相互作用にあたる、なんらかの処理が用意されている、または人間がそれを行うことを支援する。
変化を表現
個々の知識の変化、特に定性的な変化が表現されている。
システム間の相互運用性
システム間で相互運用可能である。なんらかの意味、表現、データ形式の標準化。

誤った知識を利用するシステムとはなんであろうか。また、意味が未定であるのに、なんらかの意味が標準化されているというのは、このままでは矛盾している。この問題には、次のようなアプローチが有効ではないか。

4. システム化のアプローチ

知識の意味の観点から、システム化のアプローチを次の2つに分類することができる。

意味駆動型
  • 情報の意味を事前に定義し、意味に従って処理するアプローチ
  • 正確、高速、大量、自動的にプログラムで処理
意味与奪型
  • 情報から、関心の対象となる意味を剥奪した単なる部分・区切りのみを処理の対象とすることで、対話的な編集・読み解き操作の操作性を高める。
  • 意味は利用者が理解すればよい。システムは、それには関知しない。
  • システムは、関心の対象とは別の意味に基づいて動作する。それは、たいていは関心の対象よりも抽象的な意味である。
  • われわれの着眼点、アプローチ

意味駆動型では、知識が間違っていればシステムは誤動作する。意味与奪型では、利用者の関心の対象となる意味において知識が間違っていても、システムは誤動作しない。

それでは、意味与奪型のアプローチでは、システムはどのような意味に基づいて動作するのか?それは例えば、次のように「段落」や「リスト」である。

段落(paragraph)
ある一つの主題に関する文の集まり。主題に無関係な内容の文は、同じ段落には入れない。
リスト(list)
互いに関係のある項目の集まり。項目は単語だったり文だったりする。

段落やリストは、組版において固有のレイアウトを伴うが、ここではそのようなレイアウトをさしているのではない。

システムの例

チェックリストは、そのようなシステムの例である。リストの各項目をチェック項目としてチェックリストを生成し、チェック作業を行えるシステムは、宣言的で暗黙的な知識を利用するシステムの例である。

チェックリストシステムは、知識がリストになっていることだけを要求する。自動判定などは行わない。表2で、チェックリストシステムを、さきの要件と照らし合わせてみる。

表2 知識利用システムとしてのチェックリスト

 要件 チェックリスト
受容性

リストの項目に抜けがあっても、相互に矛盾があっても、システムはチェック項目として受け入れる。

利用すること、
または相互作用

チェック項目と、チェック対象とをつき合わせることが、知識としてのリストを利用することである。

変化を表現

次ができればなお良い:

  • 利用者が必要と判断すれば、チェック対象を修正する。
  • チェック作業の過程で、チェック項目の誤りに気づけば、チェック項目を修正する。

システム間の
相互運用性

リストという構造は普遍性が高く、相互運用性が高い。

5. 考察とまとめ

難解な哲学書も旅行案内も、段落や見出しといった同じ文章の書き方に則っている。この伝統的な文章の書き方は、意味与奪型システムの基盤とするのにふさわしいと考えられる。

われわれのアプローチでツール開発を進める1つのより具体的なやり方は、紙の制約を受けて、従来は困難だった文書編集の仕方や読み方を、電子的に実現してみることである。CrossConcept[5]やSTORYWRITER[7]はそのような実装例である。

文献