カテゴリーから選ぶ
全商品
パソコン・Office
スマートフォン・タブレット
デザイン・素材集
Webサイト制作・Webマーケ
プログラミング・システム開発
ネットワーク・UNIX・DB
資格試験(一般)・大学受験
ビジネス・マネー
趣味・実用・デジカメ
理工・サイエンス
2023年7月29日紙版発売
山田育矢 監修/著,鈴木正敏,山田康輔,李凌寒 著
B5変形判/288ページ
定価3,520円(本体3,200円+税10%)
ISBN 978-4-297-13633-8
この本の概要
ChatGPTに代表される大規模言語モデルが自然言語処理の幅広いタスクで高い性能を獲得し,大きな話題となっています。大規模言語モデルは,大規模なテキストデータで訓練された大規模なパラメータで構成されるニューラルネットワークです。2020年以降,自然言語処理や機械学習の知見をもとに,パラメータ数とテキストデータの拡大により,性能が飛躍的に向上しました。
Hugging Face社の"transformers"というPythonライブラリを利用することで,プログラミングの経験があれば,モデルの操作やデータからの学習がかんたんにできます。モデルを訓練するための日本語もしくは日本語を含む多言語のデータセットも充実してきており,すぐに業務に使える実用的なモデルを作ることが可能な時代がやってきました。
本書は,大規模言語モデルの理論と実装の両方を解説した入門書です。大規模言語モデルの技術や自然言語処理の課題について理解し,実際の問題に対処できるようになることを目指しています。以下のような構成によって,理論とプログラミングの双方の側面から,大規模言語モデルに関する情報を提供します。
こんな方におすすめ
- 大規模言語モデルに興味のあるエンジニア,学生,研究者