학술행사
서울대학교 AI디지털인문학센터와 철학사상연구소에서는 AI를 활용한 서양 고전문헌 연구 플랫폼을 구축하고 있는 일본 휴마니텍스트 프로젝트의 참여 학자들을 초청하여 "AI와 함께 그려가는 인문학의 미래”라는 주제로 강연회를 개최합니다. - 일시: 3월 9일(월) 14:00~16:00 - 장소: 인문대학 4동 302호 (국제회의실) - 신청링크: https://docs.google.com/forms/d/e/1FAIpQLSchMFwLlCCIScUq4ze6Z06XV8EE0Uyqc7AWQuHfnuaeX2HFJA/viewform?usp=dialog - 문의처: 이상엽 교수 (인문대학 철학과 | AI연구원 인공지능 디지털인문학센터) sangyoplee@snu.ac.kr 강연 제목: Humanitext: AI와 함께 그려가는 인문학의 미래 (Humanitext: Shaping the Future of Humanities with AI) 강연 소개: 연사 1. Naoya Iwata (Nagoya University; National Institute of Informatics) 제목 : Humanitext Antiqua 확장: 서양 고전 문학 플랫폼을 위한 RAG 검색 정확도 향상과 코퍼스 확장 본 발표에서는 서양 고전 문학을 대상으로 한 AI 기반 플랫폼 Humanitext Antiqua의 최근 연구 진전을 소개한다. 특히 세 가지 주요 발전을 중심으로 설명한다. 첫째, 질의의 맥락을 고려한 query reformulation 기법을 통해 RAG(Retrieval-Augmented Generation) 기반 검색 정확도를 향상시킨 연구 결과를 제시한다. 둘째, 약 1,000여 작품 규모였던 코퍼스를 현재 약 2,500여 작품까지 확장하고 있는 진행 상황을 소개한다. 셋째, Wikidata 자동 연결과 인간 검토(human-in-the-loop)를 결합한 메타데이터 확장 워크플로우를 제시하며, 이를 통해 대규모 텍스트 코퍼스에 적용 가능한 확장 가능한(annotation) 전략을 설명한다. 연사 2. Ikko Tanaka (J. F. Oberlin University) 제목 : 네트워크 기반 해석으로 확장되는 서양 고전 텍스트 연구 — LLM을 활용한 텍스트, 참조, 시공간 맥락의 연결 본 발표에서는 서양 고전 텍스트 코퍼스를 벡터화하여 구축한 Humanitext 프로젝트의 확장 시스템 두 가지를 소개한다. 첫 번째 시스템인 Humanitext Reader는 원전 텍스트와 고대 주석, 현대 연구 문헌을 구조적으로 연결하는 참조 프레임워크를 구축한다. 이를 통해 인용 범위의 차이와 텍스트 판본 간 차이에서 발생하는 문제를 체계적으로 다룰 수 있도록 한다. 두 번째 시스템인 Humanitext GEO는 벡터화된 텍스트 코퍼스를 Linked Open Data 기반의 시간 및 지리 정보 체계와 결합하여, 특정 도시를 중심으로 한 동시적(synchronic)·통시적(diachronic) 탐색을 가능하게 한다. 이 두 시스템은 텍스트, 참고문헌, 그리고 시공간 맥락을 연결하는 AI 보조 해석 인프라의 구축 방향을 제시한다. 연사 3. Jun Ogawa (University of Tokyo) 제목 : Humanitext 스키마: 텍스트 자료의 연결과 지식 통합을 위한 시도와 과제 Humanitext Antiqua는 정확한 1차 텍스트 자료에 근거한 답변을 생성할 수 있지만, 관련 텍스트 단편, 주석, 그리고 2차 연구와 같은 텍스트 외적 맥락을 충분히 통합하지 못한다는 한계를 가지고 있다. 이러한 자료 간 의미적 연결은 전문가의 지식에 기반하기 때문에 단순한 벡터 유사도만으로는 포착하기 어렵다. 이에 본 연구에서는 텍스트와 다양한 맥락 정보를 지식 그래프 형태로 연결하고 이를 생성 과정에 통합하는 방식을 제안한다. 특히 첫 단계로서 텍스트와 주석 간 관계를 모델링하는 방법을 탐구하며, TEI 기반 DTS(Digital Text Service), 문자 단위 RDF 표현, 그리고 property graph 등의 접근 방식을 실험적으로 적용한다. 본 발표에서는 이러한 과정에서 이루어진 다양한 실험과 시행착오를 소개한다. Speaker 1: Naoya Iwata (Nagoya University; National Institute of Informatics) Title: Scaling Humanitext Antiqua: Advances in RAG Retrieval Accuracy and Corpus Expansion for a Western Classical Literature Platform Abstract: This talk presents recent progress on Humanitext Antiqua, an AI-powered platform for Western classical literature. We report on three developments: improvements to RAG retrieval accuracy through context-aware query reformulation; an ongoing corpus expansion from approximately 1,000 to 2,500 works; and a metadata enrichment workflow that combines automated Wikidata linking with human-in-the-loop review as a scalable annotation strategy. Speaker 2: Ikko Tanaka (J. F. Oberlin University) Title: Extending the Horizons of Western Classical Texts toward Networked Interpretation — Linking Texts, References, and Spatiotemporal Context with LLMs Abstract: This lecture presents two systems developed within the Humanitext project as extensions of its core vectorized corpus of Western Classical texts. Humanitext Reader develops a structured reference framework linking primary texts with ancient commentaries and modern research, addressing variation in citation scope and differences between textual editions. Humanitext GEO integrates the vectorized corpus with temporal and geographic frameworks through Linked Open Data, enabling city-centered synchronic and diachronic exploration. Together, these systems outline the development of an AI-assisted interpretive infrastructure connecting texts, references, and spatiotemporal context. Speaker 3: Jun Ogawa (University of Tokyo) Title: Humanitext Schema: Struggles to Connect Text Sources and Integrate Broad Knowledge Abstract: Humanitext Antiqua generates answers grounded in accurate primary sources, yet its major limitation is the insufficient integration of extra-textual context, such as related text fragments, commentaries, and secondary scholarship. Because semantic connections between sources rely on expertized knowledge, they cannot be captured through vector similarity alone. We therefore propose linking texts and contextual information through a knowledge graph and incorporating it into the generation process. Our work explores methods for modeling text–commentary relationships as a first step, including a TEI-based DTS, character-level RDF representation, and property graphs. This talk outlines our experiments and the trial-and-error process behind this approach....
2026-03-06