中国のAI研究チームが数学特化の大規模言語モデル「Qwen2-Math」を公開しました。Qwen2-MathはGPT-4oやGemini-1.5-Proなどのクローズドソースの大規模言語モデルをしのぐ数学性能を備えています。 QwenLM/Qwen2-Math: A series of math-specific large language models of our Qwen2 series.
AMDが、AMDのGPUのみでトレーニングしたという言語モデル「Instella-Math」を発表しました。パラメーター数は30億で、推論や数学的問題解決等に特化しているとのことです。 Introducing Instella-Math: Fully Open Language Model with Reasoning Capability — ROCm Blogs ...