プロフィール

博士(工学)

GitHub
X(旧Twitter)

現職

2024/4 - 国立情報学研究所大規模言語モデル研究開発センター特任研究員

職歴

2024/9 - 2025/3 理化学研究所革新知能統合研究センター言語情報アクセス技術チーム客員研究員
2020/11 - 2024/3 理化学研究所革新知能統合研究センター言語情報アクセス技術チームリサーチアソシエイト(常勤研究員)
2018/8 - 2020/10 理化学研究所革新知能統合研究センター言語情報アクセス技術チーム研究パートタイマー
2018/1 - 2018/2 理化学研究所革新知能統合研究センター言語情報アクセス技術チーム研修生

学歴

- 2025/3 筑波大学理工情報生命学術院システム情報工学研究群情報理工学位プログラム博士(工学)取得
2020/4 - 2023/3 筑波大学理工情報生命学術院システム情報工学研究群情報理工学位プログラム満期退学
2018/4 - 2020/3 豊橋技術科学大学博士前期課程情報・知能工学課程修了
2014/4 - 2018/3 豊橋技術科学大学情報・知能工学課程卒業
2011/4 - 2014/3 岐阜県立岐阜工業高等学校卒業

連絡先

共同研究等 : nakayama (at) nii.ac.jp
その他 : kouta.nakayama (at) gmail.com

研究テーマ

自然言語処理
情報抽出/固有表現抽出
知識ベース/知識グラフ
深層学習
大規模言語モデル

研究費獲得状況

2020/4 - 2023/3 JST ACT-X「AI活用で挑む学問の革新と創成」

受賞

中山功太, 児玉貴志, 鈴木久美, 宮尾祐介, 関根聡. llm-jp-judge: 日本語LLM-as-a-Judge評価ツール. 言語処理学会第31回年次大会, 2025 優秀賞(上位2%)
鈴木久美, 勝又智, 児玉貴志, 高橋哲朗, 中山功太, 関根聡. AnswerCarefully: 日本語LLM安全性向上のためのデータセット. 言語処理学会第31回年次大会, 2025 委員特別賞
関根聡, 中山功太, 野本昌子, 安藤まや, 隅田飛鳥, 松田耕史. 拡張固有表現に分類された31言語のWikipedia知識ベース, 言語処理学会第28回年次大会, 2022 委員特別賞

研究業績

査読付きジャーナル

中山功太, 栗田修平, 馬場雪乃, 関根聡, 固有表現抽出器学習のための Wikipedia リンク拡張と期待エンティティ率推定, 自然言語処理, 2024, 31 巻, 3 号, p. 1239-1291, 公開日 2024/09/15, Online ISSN 2185-8314, Print ISSN 1340-7619.

査読付き国際会議

Satoshi Sekine, Kouta Nakayama, Masako Nomoto, Maya Ando, Asuka Sumida, Koji Matsuda. Resource of Wikipedias in 31 Languages Categorized into Fine-Grained Named Entities. Proceedings of the 29th International Conference on Computational Linguistics(COLING), 2022
Kouta Nakayama, Shuhei Kurita, Akio Kobayashi, Yukino Baba, Satoshi Sekine. Co-Teaching Student-Model through Submission Results of Shared Task. Findings of the Association for Computational Linguistics: EMNLP, 2021
Satoshi Sekine, Kouta Nakayama, Maya Ando, Yu Usami, Masako Nomoto, Koji Matsuda. SHINRA2020-ML: Categorizing 30-language Wikipedia into fine-grained NE based on”``Resource by Collaborative Contribution” scheme. 3rd Conference on Automated Knowledge Base Construction(AKBC), 2021
Satoshi Sekine, Akio Kobayashi, Kouta Nakayama. Shinra: Structuring wikipedia by collaborative contribution. Automated Knowledge Base Construction(AKBC), 2018

国際会議

Satoshi Sekine, Masako Nomoto, Kouta Nakayama, Asuka Sumida, Koji Matsuda, Maya Ando. Overview of shinra2020-ml task. Proceedings of the NTCIR-15 Conference, 2020
Kouta Nakayama, Satoshi Sekine. LIAT Team’s Extractive Summarizer at NTCIR-15 QALab PoliInfo-2. NTCIR 15 Conference: Proceedings of the 15th NTCIR Conference on Evaluation of Information Access Technologies, 2020
Kouta Nakayama, Satoshi Sekine. LIAT Team’s Wikipedia Classifier at NTCIR-15 SHINRA2020-ML: Classification Task. The 15th NTCIR Conference Evaluation of Information Access Technologies (NTCIR-15), 2020

国内会議

中山功太, 児玉貴志, 鈴木久美, 宮尾祐介, 関根聡. llm-jp-judge: 日本語LLM-as-a-Judge評価ツール. 言語処理学会第31回年次大会, 2025 優秀賞(上位2%)
鈴木久美, 勝又智, 児玉貴志, 高橋哲朗, 中山功太, 関根聡. AnswerCarefully: 日本語LLM安全性向上のためのデータセット. 言語処理学会第31回年次大会, 2025 委員特別賞
井之上直也, 安藤まや, 後藤美知子, 関根聡, 中山功太, 宮尾祐介. 日本語を対象としたLLMの大規模人手評価. 言語処理学会第31回年次大会, 2025
古橋萌々香, 中山功太, 児玉貴志, 菅原朔. 生成系タスクの自動評価においてチェックリストの使用は有効なのか？. 言語処理学会第31回年次大会, 2025
関根聡, 宇佐美佑, 門脇一真, 三浦明波, 中山功太, 安藤まや. 森羅プロジェクト. 言語処理学会第30回年次大会, 2024
守山慧, 中山功太, 馬場雪乃. マッチング数制約下でのアノテーション検証割り当ての自動化. 言語処理学会第30回年次大会, 2024
関根聡, 中山功太, 隅田飛鳥, 渋木英潔, 門脇一真, 三浦明波, 宇佐美佑, 安藤まや. 森羅タスクと森羅公開データ. 言語処理学会第29回年次大会, 2023
守山慧, 中山功太, 馬場雪乃. 専門家と非専門家によるアノテーション検証の割当の自動化. 言語処理学会第29回年次大会, 2023
中山功太, 栗田修平, 小林暁雄, 馬場雪乃, 関根聡. 共有タスクへの結果提出を通した生徒モデルの共同教育手法. 言語処理学会第28回年次大会, 2022
関根聡, 中山功太, 野本昌子, 安藤まや, 隅田飛鳥, 松田耕史. 拡張固有表現に分類された31言語のWikipedia知識ベース, 言語処理学会第28回年次大会, 2022 委員特別賞
野本昌子, 宇佐美佑, 安藤まや, 中山功太, 関根聡. 森羅 2021-LinkJP 結果の分析:BERT とルールベースの比較. 言語処理学会第28回年次大会, 2022
林歓樹, 中山功太, 関根聡. クラス定義文を用いたWikipedia記事の分類. 言語処理学会第28回年次大会, 2022
坂田将樹, 中山功太, 竹下昌志, ジェプカラファウ, 関根聡, 荒木健治. 日本語Wikipediaからの属性値抽出タスクにおけるクエリの有効性検証. 言語処理学会第28回年次大会, 2022
栗本真太郎, 中山功太, 藤田智也, 馬場雪乃. 評価順バイアスを考慮した一対比較モデル. 人工知能学会全国大会論文集第35回, 2021
中山功太, 修平栗田, 雪乃馬場, 関根聡. 能動的サンプリングを用いたリソース構築共有タスクにおける予測対象データ削減. 言語処理学会第27回年次大会, 2021
関根聡, 野本昌子, 中山功太, 隅田飛鳥, 松田耕史, 安藤まや. SHINRA2020-ML:30言語のWikipediaページの分類. 言語処理学会第27回年次大会, 2021
中山功太, 栗田修平, 小林暁雄, 関根聡. Pre-Distillation Ensemble:リソース構築タスクのためのアンサンブル手法. 言語処理学会第26回年次大会, 2020
小林暁雄, 中山功太, 安藤まや, 関根聡. Wikipedia構造化プロジェクト「森羅2019-JP」. 言語処理学会第26回年次大会, 2020
中山功太, 小林暁雄, 関根聡. 共有タスクにおけるGA重み付け加重投票を用いた属性値アンサンブル. 言語処理学会第25回年次大会, 2019
小林暁雄, 中山功太, 関根聡. 森羅:Wikipedia構造化プロジェクト2018結果の分析と考察. 言語処理学会第25回年次大会, 2019

プレプリント

LLM-jp. LLM-jp:A Cross-organizational Project for the Research and Development of Fully Open Japanese LLMs. arXiv, 2024
Issa Sugiura, Kouta Nakayama, Yusuke Oda, llm-jp-modernbert: A ModernBERT Model Trained on a Large-Scale Japanese Corpus with Long Context Length. arXiv, 2025
Hisami Suzuki, Satoru Katsumata, Takashi Kodama, Tetsuro Takahashi, Kouta Nakayama, Satoshi Sekine. AnswerCarefully: A Dataset for Improving the Safety of Japanese LLM Output. arXiv, 2025

学会誌記事等

中山功太, 渋木英潔, 関根聡. 学生・若手研究者のための BERT ワークショップ. 自然言語処理 2023 年 30 巻 1 号 p. 226-233, 2023