プロフィール
博士(工学)
現職
- 2024/4 - 国立情報学研究所 大規模言語モデル研究開発センター 特任研究員
職歴
- 2024/9 - 2025/3 理化学研究所 革新知能統合研究センター言語情報アクセス技術チーム 客員研究員
- 2020/11 - 2024/3 理化学研究所 革新知能統合研究センター言語情報アクセス技術チーム リサーチアソシエイト(常勤研究員)
- 2018/8 - 2020/10 理化学研究所 革新知能統合研究センター言語情報アクセス技術チーム 研究パートタイマー
- 2018/1 - 2018/2 理化学研究所 革新知能統合研究センター言語情報アクセス技術チーム 研修生
学歴
- - 2025/3 筑波大学 理工情報生命学術院システム情報工学研究群情報理工学位プログラム 博士(工学)取得
- 2020/4 - 2023/3 筑波大学 理工情報生命学術院システム情報工学研究群情報理工学位プログラム 満期退学
- 2018/4 - 2020/3 豊橋技術科学大学 博士前期課程 情報・知能工学課程 修了
- 2014/4 - 2018/3 豊橋技術科学大学 情報・知能工学課程 卒業
- 2011/4 - 2014/3 岐阜県立岐阜工業高等学校 卒業
連絡先
- 共同研究等 : nakayama (at) nii.ac.jp
- その他 : kouta.nakayama (at) gmail.com
研究テーマ
- 自然言語処理
- 情報抽出/固有表現抽出
- 知識ベース/知識グラフ
- 深層学習
- 大規模言語モデル
研究費獲得状況
- 2020/4 - 2023/3 JST ACT-X「AI活用で挑む学問の革新と創成」
受賞
- 中山 功太, 児玉 貴志, 鈴木 久美, 宮尾 祐介, 関根 聡. llm-jp-judge: 日本語LLM-as-a-Judge評価ツール. 言語処理学会 第31回年次大会, 2025. 優秀賞(上位2%)
- 鈴木 久美, 勝又 智, 児玉 貴志, 高橋 哲朗, 中山 功太, 関根 聡. AnswerCarefully: 日本語LLM安全性向上のためのデータセット. 言語処理学会 第31回年次大会, 2025. 委員特別賞
- 関根聡, 中山功太, 野本昌子, 安藤まや, 隅田飛鳥, 松田耕史. 拡張固有表現に分類された31言語のWikipedia知識ベース, 言語処理学会 第28回年次大会, 2022. 委員特別賞
研究業績
査読付きジャーナル
- 中山 功太, 栗田 修平, 馬場 雪乃, 関根 聡, 固有表現抽出器学習のための Wikipedia リンク拡張と期待エンティティ率推定, 自然言語処理, 2024, 31 巻, 3 号, p. 1239-1291, 公開日 2024/09/15, Online ISSN 2185-8314, Print ISSN 1340-7619.
査読付き国際会議
- Momoka Furuhashi, Kouta Nakayama, Takashi Kodama, Saku Sugawara. Are Checklists Really Useful for Automatic Evaluation of Generative Tasks? The 2025 Conference on Empirical Methods in Natural Language Processing (EMNLP2025 Main), 2025.
- Satoshi Sekine, Kouta Nakayama, Masako Nomoto, Maya Ando, Asuka Sumida, Koji Matsuda. Resource of Wikipedias in 31 Languages Categorized into Fine-Grained Named Entities. Proceedings of the 29th International Conference on Computational Linguistics(COLING), 2022.
- Kouta Nakayama, Shuhei Kurita, Akio Kobayashi, Yukino Baba, Satoshi Sekine. Co-Teaching Student-Model through Submission Results of Shared Task. Findings of the Association for Computational Linguistics: EMNLP Findings, 2021.
- Satoshi Sekine, Kouta Nakayama, Maya Ando, Yu Usami, Masako Nomoto, Koji Matsuda. SHINRA2020-ML: Categorizing 30-language Wikipedia into fine-grained NE based on”``Resource by Collaborative Contribution” scheme. 3rd Conference on Automated Knowledge Base Construction(AKBC), 2021.
- Satoshi Sekine, Akio Kobayashi, Kouta Nakayama. Shinra: Structuring wikipedia by collaborative contribution. Automated Knowledge Base Construction(AKBC), 2018.
国際会議
- Satoshi Sekine, Masako Nomoto, Kouta Nakayama, Asuka Sumida, Koji Matsuda, Maya Ando. Overview of shinra2020-ml task. Proceedings of the NTCIR-15 Conference, 2020.
- Kouta Nakayama, Satoshi Sekine. LIAT Team’s Extractive Summarizer at NTCIR-15 QALab PoliInfo-2. NTCIR 15 Conference: Proceedings of the 15th NTCIR Conference on Evaluation of Information Access Technologies, 2020.
- Kouta Nakayama, Satoshi Sekine. LIAT Team’s Wikipedia Classifier at NTCIR-15 SHINRA2020-ML: Classification Task. The 15th NTCIR Conference Evaluation of Information Access Technologies (NTCIR-15), 2020.
国内会議
- 政野 美和, 欅 リベカ, 欅 惇志, 清丸 寛一, 中山 功太, 堀尾 海斗, 源 怜維, 橘 秀幸, 河原 大輔. LLMの生成テキストの真偽検証のための日本語言説分解データセットの構築. 言語資源ワークショップ2025 (LRW2025), 2025.
- 中山 功太, 児玉 貴志, 鈴木 久美, 宮尾 祐介, 関根 聡. llm-jp-judge: 日本語LLM-as-a-Judge評価ツール. 言語処理学会 第31回年次大会, 2025. 優秀賞(上位2%)
- 鈴木 久美, 勝又 智, 児玉 貴志, 高橋 哲朗, 中山 功太, 関根 聡. AnswerCarefully: 日本語LLM安全性向上のためのデータセット. 言語処理学会 第31回年次大会, 2025. 委員特別賞
- 井之上 直也, 安藤 まや, 後藤 美知子, 関根 聡, 中山 功太, 宮尾 祐介. 日本語を対象としたLLMの大規模人手評価. 言語処理学会 第31回年次大会, 2025.
- 古橋 萌々香, 中山 功太, 児玉 貴志, 菅原 朔. 生成系タスクの自動評価においてチェックリストの使用は有効なのか?. 言語処理学会 第31回年次大会, 2025.
- 関根聡, 宇佐美佑, 門脇一真, 三浦明波, 中山功太, 安藤まや. 森羅プロジェクト. 言語処理学会 第30回年次大会, 2024.
- 守山慧, 中山功太, 馬場雪乃. マッチング数制約下でのアノテーション検証割り当ての自動化. 言語処理学会 第30回年次大会, 2024.
- 関根聡, 中山功太, 隅田飛鳥, 渋木英潔, 門脇一真, 三浦明波, 宇佐美佑, 安藤まや. 森羅タスクと森羅公開データ. 言語処理学会 第29回年次大会, 2023.
- 守山慧, 中山功太, 馬場雪乃. 専門家と非専門家によるアノテーション検証の割当の自動化. 言語処理学会 第29回年次大会, 2023.
- 中山功太, 栗田修平, 小林暁雄, 馬場雪乃, 関根聡. 共有タスクへの結果提出を通した生徒モデルの共同教育手法. 言語処理学会 第28回年次大会, 2022.
- 関根聡, 中山功太, 野本昌子, 安藤まや, 隅田飛鳥, 松田耕史. 拡張固有表現に分類された31言語のWikipedia知識ベース, 言語処理学会 第28回年次大会, 2022. 委員特別賞
- 野本昌子, 宇佐美佑, 安藤まや, 中山功太, 関根聡. 森羅 2021-LinkJP 結果の分析:BERT とルールベースの比較. 言語処理学会 第28回年次大会, 2022.
- 林歓樹, 中山功太, 関根聡. クラス定義文を用いたWikipedia記事の分類. 言語処理学会 第28回年次大会, 2022
- 坂田将樹, 中山功太, 竹下昌志, ジェプカラファウ, 関根聡, 荒木健治. 日本語Wikipediaからの属性値抽出タスクにおけるクエリの有効性検証. 言語処理学会 第28回年次大会, 2022.
- 栗本真太郎, 中山功太, 藤田智也, 馬場雪乃. 評価順バイアスを考慮した一対比較モデル. 人工知能学会全国大会論文集 第35回, 2021.
- 中山功太, 修平栗田, 雪乃馬場, 関根聡. 能動的サンプリングを用いたリソース構築共有タスクにおける予測対象データ削減. 言語処理学会 第27回年次大会, 2021.
- 関根聡, 野本昌子, 中山功太, 隅田飛鳥, 松田耕史, 安藤まや. SHINRA2020-ML:30言語のWikipediaページの分類. 言語処理学会 第27回年次大会, 2021.
- 中山功太, 栗田修平, 小林暁雄, 関根聡. Pre-Distillation Ensemble:リソース構築タスクのためのアンサンブル手法. 言語処理学会 第26回年次大会, 2020.
- 小林暁雄, 中山功太, 安藤まや, 関根聡. Wikipedia構造化プロジェクト「森羅2019-JP」. 言語処理学会 第26回年次大会, 2020.
- 中山功太, 小林暁雄, 関根聡. 共有タスクにおけるGA重み付け加重投票を用いた属性値アンサンブル. 言語処理学会 第25回年次大会, 2019.
- 小林暁雄, 中山功太, 関根聡. 森羅:Wikipedia構造化プロジェクト2018結果の分析と考察. 言語処理学会 第25回年次大会, 2019.
プレプリント
- LLM-jp. LLM-jp:A Cross-organizational Project for the Research and Development of Fully Open Japanese LLMs. arXiv, 2024.
- Issa Sugiura, Kouta Nakayama, Yusuke Oda, llm-jp-modernbert: A ModernBERT Model Trained on a Large-Scale Japanese Corpus with Long Context Length. arXiv, 2025.
- Hisami Suzuki, Satoru Katsumata, Takashi Kodama, Tetsuro Takahashi, Kouta Nakayama, Satoshi Sekine. AnswerCarefully: A Dataset for Improving the Safety of Japanese LLM Output. arXiv, 2025.
学会誌記事等
- 大北 剛, 勝又 智, 鎌田 啓輔, 清丸 寛一, 児玉 貴志, 鈴木 潤, 中山 功太, Namgi Han, 宮尾 祐介. NLP2025 併設ワークショップ「大規模言語モデルのファインチューニング技術と評価」. 自然言語処理 2025 年 32 巻 2 号 p. 746-750, 2025.
- 中山功太, 渋木英潔, 関根聡. 学生・若手研究者のための BERT ワークショップ. 自然言語処理 2023 年 30 巻 1 号 p. 226-233, 2023.