Deutsches Institut für Japanstudien nav lang search
日本語EnglishDeutsch
Deutsches Institut für Japanstudien

デジタル方法を用いる概念史の研究

 2020年1月年〜

テキストマイニング・アルゴリズムは大量のテキストを体系的に調査する可能性を提供する。分析は数少ない主要なテキストに限る必要がないので、概念史の研究には非常に有望である。アルゴリズムの機能とその制限が明らかにされる場合、古典的な分析方法と結び合わせることが、量的研究の利点も質的研究の利点をももたらす。

 2000年代後半以降、辞書ベースの分類やクラスター分析などの古典的なアルゴリズムに加えて、いわゆる潜在的ディリクレ配分法(LDA)を使用してテキストコーパス内のトピックをモデル化する方法が登場している。そのトピックモデルは、本質的に単語の多義性さを考慮に入れているという事が特徴である。

 トピックモデルを直接に評価することは、分析されたテキストコーパスの(フランコ・モレッティに考案された)「遠読」であるとして理解することができる。補足として、コーパスのいくつかのテキストを「精読」することが一般的となった。これらのステップをグラウンデッドセオリー法で体系的に組み合わせることにより、研究プロジェクトは、LDAトピックモデルを使用する分析を、ラインハート・コゼレックの伝統を受け継ぐ概念史に適用することを目的としている。

 ここでは、テキストのジャンレの特徴や、カテゴリーの作成を主導するメタデータの多様性を考慮する必要がる。日本語のテキストコーパスを扱うことが興味深い理由に、漢字が表語文字であるということもある。中国やヨーロッパからの知識の受容の過程において、概念が新造されたり影響を受けたりし、その後、実質的な独自の発展をしてきたことが特に重要である。