知の表現基盤研究部門: 概念の構造と表現に関する研究

【研究題目】編曲者意図を的確に表す記号体系
【担当者】松本光明(知識情報・図書館学類),真栄城哲也(部門研究員)

 演奏者は,楽譜に記された音や記号をもとに楽曲を演奏するが,楽譜の作成者である作曲者・編曲者の意図は,楽譜上の楽音・音楽記号を通じてのみ伝えられる.編曲者の意図を元にした視覚的な記号を用いることで,作成者側の意図を,視覚的かつ直感的に演奏者側へと伝達することが可能となる.作曲者の意思決定のモデルに関する研究はすでに行われているが,本研究で対象とする編曲者の意図に関する記号化は初期段階にあり,また,本研究で対象とする混声無伴奏合唱譜についての研究は見当たらない.
  まず,我々が編曲した童謡 2 曲(「ふるさと」,「もみじ」)について楽譜分析を行い,記号案を作成した.音楽の 3 要素(旋律・和音・リズム),コード進行(原曲コード・リハーモナイズ),前後の楽音との関係(連続的・選択的),選択した理由(理論的・感性的)を分析し,編曲意図を記述するための記号体系を作成した.本記号体系では,(1)音楽の3要素による色分け,(2)分析時の語句に合わせた視覚的記号,(3)その他編曲意図に合わせた記号,を複合的に用いる.
 この記号体系を用いて,演奏者を対象としたアンケート調査を実施し,作成した記号の有用性の検証や改善を行った.アンケート調査では,記号の付与されていない楽譜と,付与されている楽譜について,それぞれ編曲者の意図が楽譜中のどの部分に含まれているかを調べた.音楽の3要素(旋律・和音・リズム)は多肢選択式(複数回答可),選択要素については自由記述とした.さらに,記号の有効性を計測するため,記号作成時に用いた編曲者による分析済みチェックリストを(1)配布した場合と(2)しない場合について比較した.
 調査の結果,「ふるさと」と「もみじ」の両楽曲において,全被験者34名中,合計得点は2名のみ減少,平均して2倍程度増加した.また,編曲者チェックリストの配布の有無を比較すると,(1)配布なしでは18名中1名であるのに対し,(2)配布ありの被験者は16名中1名であった.また,得点が増加した割合の平均をみると,(1)配布なし(2)配布ありどちらもほぼ同程度であった.以上のことから,記号の付与が被験者の楽譜読み取りに作用し,編曲者の意図をより正確に読み取ることを可能にすると言える.また,編曲者チェックリスト配布による理解度の変化は見られず,記号のみの付与でも十分に編曲者の意図を伝達できていると考えられる.よって,本研究で作成した記号は編曲者の意図を視覚的かつ直感的に表せていると考えられる.

 

【研究題目】対象年齢の異なる百科事典の比較による対象読者に考慮した説明内容及び説明文章の検討
【担当者】鈴木陽香(知識情報・図書館学類),橋本舞子(知識情報・図書館学類),中山 伸一(共同研究員)

 知識を異なる人の間や世代を越えて伝達するには,百科事典や教科書などのように文章として記述することが一般的である.その際,読み手一人一人の既有知識やニーズが異なることから,一通りの説明文でけで全ての読み手に適切な知識の伝達を行うことはできない.読み手を想定して,記述する説明の内容や文章表現を変える必要がある.本研究では,想定する対象年齢の違いが説明文においてどのような内容や文章表現の違いを引き起こしているのかを明らかにする事を目的とする.
 調査対象を,高学年向け百科事典と低学年向け百科事典とし,内容においては低学年向けの説明文では具体的な説明が多く,高学年向けの説明文では抽象的な説明文が多い,高学年向けの説明文では低学年向けの説明文にない説明の視点が存在しているという仮説を設定した.文章表現については,文章表現の複雑さを表す指標は低学年向けより高学年向けの文章の方が高くなるという仮説を設定した.
 説明文の内容は,外見,構成・成分,全体,性質,出来方,変わり方,機能,用途・用法,変遷,上位概念,下位概念,対比,等価の用語,反対語の14種類の説明の視点で分類した.その結果,具体的な説明も抽象的な説明も高学年向け百科事典にある場合の方が多いが,具体的な説明に関しては局所的には低学年向け百科事典に多い場合も見られることが分かった.また,14 種類の説明の視点のうち10種類の説明の視点は高学年向け百科事典の方が多く使われていることが分かった.特に「構成・成分」,「変わり方」,「機能」,「用途・用法」,「等価の用語」などは高学年向け百科事典で多く見られ,これらの説明は低学年向け百科事典の対象読者には複雑であるため,低学年向け百科事典では省かれていた.
 説明文の文章の複雑さの指標は,1文あたりの主述の組の数,1文あたりの述語数,1文あたりの動詞が文頭に来て形容語になっている文節の数,主述の組ごとの主語の欠損数,1文あたりの挿入句の数,1文あたりの挿入句の文節数,1文あたりの主述間の距離,1文あたりの係りの次数,1文あたりの主語に係る次数,1文あたりの受身の文節数,1文あたりの文節数,の11個を設定し,形態素解析および構文解析を用いて抽出した.その 結果,1文あたりの述語数,1文あたりの挿入句の文節数,1文あたりの係りの次数には有意差が見られず,主述の組ごとの主語の欠損数,1文あたりの主語に係る次数は子ども向けの方が大きくなった.このように,対象とする読み手の年齢による文章構造の違いと,文構造の複雑さは一致しない部分があることが明らかになった.

 

【研究題目】ビットの使用状況の分析に基づくフィンガープリントの比較研究
【担当者】稲次豊広(図書館情報メディア研究科),中山伸一(共同研究員)

 化合物の構造情報を扱うための構造記述子のひとつとしてフィンガープリントがある.フィンガープリントは構造キーの組合せによって数多く提案されているが,データセットの特性や導き出したい結果を考慮してフィンガープリントを選択するための指標はこれまでほとんと検討されていない.本研究では,対象とするデータベースに含まれる化合物群に対するフィンガープリントのビットの使用状況に基づいて得られる『識別能』をフィンガープリントの特徴量として提案した.また,多様な化合物に対する重複して検索された化合物の状況を,フィンガープリントの類似性を評価する方法として提案した.
 提案した指標および方法の妥当性を検証するため,NCBIのPubChem Databaseを対象として用い,MACCS,PubChem,Substructure,Estateおよび Daylightの5つのフィンガープリントについて,識別能および重複検索化合物の状況を調べた.その結果,識別能においては全てのフィンガープリントで理論値と実測値が大きく異なっていることが明らかになった.特にSubstructureやEstateでは,識別能が検索用途として実用的でない値にまで低下していた.PubChemは十分な識別能を持つが,識別能力が低いビットが多いため,理論値からの下落率は大きい.DaylightはPubChemとほぼ同数のビット数を持つが, 識別能力の高いビットが多いためPubChemより約3倍の識別能を持つことが分かった.MACCSの識別能はDaylightやPubChemより低いが実用的な値を持ち,理論値からの下落率は比較的低かった.
 一方,重複検索化合物においては,フィンガープリントの類似性について上位30化合物を比較した結果,全く同じ化合物が検索された場合の数は全体的に中央値が10前後,IQR(Interquartile range)が5前後となり,ほぼ横並びになった.ただ,PubChemとDaylight間のみ他の結果と異なり,中央値が15近くと比較的高い重複数を相互に示した.PubChemとDaylight間以外は,類似性の基準がフィンガープリントによって異なる傾向が示されたことから,類似性検索などではフィンガープリントの選択が重要であることが分かった.

 

【研究題目】言葉の類型化による「面白い」概念の類型化
【担当者】山下教子(知識情報・図書館学類),中山伸一(部門研究員)

 「面白い」をはじめとして,我々が日常用いている用語は多様々な概念を包含している場合が多い.本研究では,用語の持つ概念を,用語が包含する概念を表す用語の分類を行うことにより明確化することを考え,その方法の妥当性を「面白い」を用いて検討した.具体的には,類語辞書等から「面白い」に関わる用語94語を抽出し,それらを被験者実験によりその類似性に基づき分類させ,その分類パターンを分析した.
 実験の結果,分類は大きく2つのタイプに分かれるが,ほぼ同様の内容であることが分かった.一方のタイプを分析すると「可笑しい」,「爽快な」,「色艶のある」というポジティブ感情,「怖い,エキサイティングな」という中性感情,「じれったい」,「切ない」というネガティブ感情,「成長する」,「コクのある」,「巧妙な」というメッセージの評価という類型が認められた.
 以上の結果は,共感等による多様な感情誘起(enjoy)と知識獲得(interesting)による面白さあるというこれまでの研究に対応するものであり,用語分類による方法の妥当性が示唆された.

 

【研究題目】作曲に関わる知識
【担当者】真栄城哲也(部門研究員),中山伸一(部門研究員)

 プロの作曲家に2曲の作曲を依頼し,作曲過程の記述を解析した.これらは,どちらも100小節前後,演奏時間6~8分,3パート (楽器) の楽曲であり,主な違いは調性音楽か半調性音楽かという点である.作曲過程の意思決定の記述は作曲家自身が文章で書くが,作曲と同時に記述するのではなく,作業の段階毎にまとめて書く.ここでの作業段階とは,作曲家自身が決めるものであり,作曲の作業スタイルや作曲している楽曲の種類に依存する.作業段階の区切りは時間でも楽曲の意味のあるまとまりでも構わない.各作業段階毎に,作曲家がその前の作業段階以降に実行した内容を列挙し,各変更点の意図や内容と,その変更に関わる意思決定の種類を記述する.意思決定の種類として,(A) 理論,(B) 選択,(C) 経験の3種類があり,この中から1つを選択する.作曲者自身による意思決定の記述を,ハイパーネットワークモデルで表現するが,その際に意思決定の規模を均一化する.これは,以降の他の楽曲や同じ楽曲内の意思決定との関係性を記述するためである.その結果,理論に基づく意思決定は作曲の初期段階では多いが,後半になる程,減少し,選択は全過程を通して少なく,3つ目の経験は最も多く,全過程で同等の数であることが判った.

 

【研究題目】構文木の構造に着目した文章の判りやすさの定量的解析
【担当者】石原亜紗希(本学図書館情報専門学群),中山伸一(協力研究者),真栄城哲也(部門研究員)

 本研究では,文章の判り易さを理解度と通読性の側面から捉え,係り受けの距離および構文の深さの2つの定量的な指標を用いて文章を解析する.判り易さには様々な要因があり,文章の判りやすさについては様々な研究が発表されていると同時に,文章を判り易く書く方法についての本も多く出版されている.文章の判り易さには様々な側面があるが,本研究では文章の理解度と通読性を扱う.理解度とは,文脈や文節間の関係等,文章の内容を違えることなく理解できる度合いとし,また,通読性とは,音読や黙読する際に,文章を閊えることなく読める度合い,とする.
 判り易さの指標として,主に経験則に基づくと思われる指標が多数提唱されている.従って,文章の書き方について書かれた計20冊の本から文章の判り易さに影響する要因を抽出した.これらから得られた417項目を分類し,23のグループに属する合計98項目を得た.さらに,数量化や自動化の可能性に基づき,判り易さへの影響を解析するために以下の 2つの要因を選択した.(A) 係り受け距離,(B) 構文木の深さ,である.
 計量化の妥当性を検証するために,異なる内容および文字数の文章を6個用意し,被験者実験および数値解析により選択した2つの要因の関連を分析する.6つの文章それぞれに,係り受け距離が異なる文章を2通り用意し,ペア毎に被験者に読んでもらい,判り易いと判断した文章を選んでもらう.被験者には全ての文章 (計12) を提示するが,被験者毎にペアの提示順序やペア間の順序を変更する.
 用意した文章の文字数は60から520文字であり,文の数は1から6である.それぞれの文章において,文章全体の係り受け距離を長くした文章 (a) と,構文構造を表す構文木の深さを増加した文章 (b) を用意する.後者は,文節の連なりを長くする操作を含む.なお,構文解析には KNPを用いた.
 21人の大学生を対象に被験者実験を行った結果,係り受け距離が長い文章と構文木の深い文章のペアの内,分かり易いと選択された文章は内容に依存した.これらの結果から,係り受け距離の長い方がより分かり易いと判断される傾向が強いが,必ずしも成立せず,他の要因の影響があると考えられる.さらに,それぞれの文章から生成される2つの文章 (a) と (b) を主語と述語に着目して解析したところ,主語と述語間の距離の関与が示唆された.文節毎の係り受け距離を同一文章のペア(a) と (b) で比較すると,係り受け距離の増減の度合いと,(a) が分かり易いと選択された割合に関連性が見られた.
 本研究では,係り受け距離と構文木の深さを変動させて文章を生成するが,両者は関連するパラメータである.ここで用いた12個 (6ペア) の文章は,両パラメータを同時に変化させるように文章生成した.一般的に,一方が増加すれば他方は減少するが,例外も存在するため,係り受け距離と構文木の深さをどちらも判り易さの要因とした.両パラメータの値の関係が反比例であれば,本研究で用いた文章の判り易さの要因を1つに集約できるが,さらなる検討が必要である.また,構文解析についても検討が必要である.

 

【成果公表】

    1. T. Maeshiro, S. Nakayama, M. Maeshiro: Multilevel Decision Structure in Music Composition Process of Tonal Piece. Proceedings of 8th International Conference on Humanized Systems, 27 ~ 32, 2012.
    2. 松本光明,中山伸一,真栄城哲也:編曲者の意図を明示的に表わす記号体系の提案.情報処理学会第75回全国大会,5ZF-7,2013.3
    3. 稲次豊広,中山伸一:ビットの使用状況の分析に基づくフィンガープリントの比較研究.第35回情報化学討論会,P01,2012.10<ポスター賞受賞>
    4. 真栄城哲也,「関係性に基づく表現と知識」,関係論的システム科学調査研究会例会,2012
    5. T. Maeshiro, S. Nakayama, M. Maeshiro, “Representation of decision making process in music composition based on hypernetwork model,” Proceedings of 14th International Conference on Human-Computer Interaction, pp.109–117, 2011.
    6. T. Maeshiro, S. Nakayama, Y. Ozawa, “Knowledge Infrastructure for Knowledge Sharing among Patients, Doctors and Researchers,” 2012 AAAI Spring Symposium Technical Report, SS-12-05, 2012.
    7. 石原亜紗希,中山伸一,真栄城哲也,「構文木の構造に着目した文章の判りやすさの定量的解析」電子情報通信学会総合大会,2010年3月16日~19日
    8. 石原亜紗希,中山伸一,真栄城哲也,「文章の判りやすさの定量的な指標について」情報処理学会第72会全国大会,2-347-348,2010年3月9日~11日