こんな夢を見た

修士学生による自然言語処理研究の記録。主にDeep LearningやEmbedding関連論文の軽い自分用まとめとして。内容に誤りが含まれている場合があります。お気軽にご指摘ください。

Logical Inference on Dependency-based Compositional Semantics

Logical Inference on Dependency-based Compositional Semantics
Ran Tian, Yusuke Miyao, Takuya Matsuzaki

DCSを使った論理推論。
DCSで表現された文からabstract denotationを得る方法の提案、そして、それを用いて新たな(DCS形式)文を自動作成するような枠組みの提案。それで文の含意関係認識タスクを行っている。

詳細はさておいて、abstract denotationについてのみまとめる。

abstract denotationは、ある条件を満たすようなentityの集合を指し示せる表現になっている。具体的には、関係代数の演算子で構成されたような式。これを使えばあるDCS形式の文をデータベースへのクエリ表現にできる。というかこの式自体がほぼクエリそのものになっている。
例えば、students read booksは read∩(studentSUBJ×bookOBJ)となる。式中のstudent, bookはそれぞれの単語が示せるようなentity集合で、下添字がついていればそのsemantic roleを満たすentityにさらに限られた集合。readも同様だが、こっちはrelationを示すために、entityペアの集合(e1×e2 の集合)。そして、「∩」演算子によって「readのrelationを満たすようなentityペアで、かつ、SUBJがstudentの要素でOBJがbookの要素であるペア の集合」が得られる、といった具合。これを合成していけば色んな表現ができる。
演算子は、デカルト積×、交差∩、射影πr(relationのeペアのrのroleの方のみ)、商。他にrelabelingというbookをbookrのように変える演算子(これは割と形式的なものだと思う)。
あるentityについて表すこともできるし、文そのままの形でrelationとして表すこともできる。つまりは、基本的には「文」は「relation名 と ペア集合」で表される(表せるという世界観の)ようだ。
ちょっとそこからは外れるけど、negationやantonymを表すために || という演算子?もある。riseとfallの排他的公理をrise || fall としたり、no dogs are hurt というような否定文を dog || πOBJ(hurt) と表したりするようだ。ある種、"矛盾"というrelation表を特殊な形式で書き表しているようにも受け取れるかもしれない。

時制等の説明は特にしていないけど、この世界観でもタスク用のデータセットでは十分いけるのかもしれない。 論理推論等の説明は触れない。確かにいけそうという納得感はあった。