ゼロから作るDeep Learning 6 LLM編を買った。めちゃくちゃわかりやすい。事後学習がこんなに重要とは知らなかった。KVキャッシュって何やってるか等も。Interface誌の7月号特集が作りながら学ぶTransformer/LLMなので一緒に読みながらだとより理解が深まる。
ゼロから作るDeep Learning 6 LLMを買った。非常にわかりやすい本。
AttensionやTransformerのことはうっすら知っているものの、なんで次の単語予測器がこんな会話ができるようになるのか、が全然わからなかったが、事後学習(SFT)でやりとりを教えることでできるようになることを初めて知った!実際にCodeBot、StoryBotなどを作りながら進めるのでとてもわかりやすい。これもうっすら知っているMoEやKVキャッシュについてもなるほどこういうことかと納得。
CQ出版のInterfaceの2026年7月号も「作りながら学ぶTransformer/LLM」で内容が被るものも多く、合わせて読むとよりわかる。
こちらは最新のアーキテクチャなども紹介されていて参考になる。














最近のコメント