「LLM」のニュース一覧
-
★ニュース速報+ 894res 7.4res/h
【IT】ついにAI学習のためのデータが枯渇へ、データセット不足のAI企業は大規模で汎用的なLLMから専門性の高いモデルへ移行か
AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。...
-
★科学ニュース+ 1res 0.0res/h
【IT】「Xのアルゴリズム」は数日であなたの政治的意見を変えられる――米スタンフォード大が1000人以上で検証
「Xのアルゴリズム」は数日であなたの政治的意見を変えられる――米スタンフォード大が1000人以上で検証米スタンフォード大学などに所属する研究者らが発表した論文「Social Media Algorithms Can Shape Affective P...
-
★科学ニュース+ 6res 0.0res/h
【AI】LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表
LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表 MITの研究者らは2024年10月10日、スパース・オートエンコーダー(SAE)技術を用いて、大規模言語モデル(LLM)の内部に潜む構造を解明す...
-
★科学ニュース+ 22res 0.0res/h
【AI】朝日新聞社のLLM評価手法論文、国際学会EMNLPで採択・・・AI応答に含まれる嘘の低減につながる研究
朝日新聞社のLLM評価手法論文、国際学会EMNLPで採択・・・AI応答に含まれる嘘の低減につながる研究株式会社朝日新聞社は、同社のメディア研究開発センター員である川畑輝氏が主著した論文が、自然言語処理分野におけ...
-
★科学ニュース+ 14res 0.0res/h
【AI】GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?
GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論...
-
★ビジネスニュース+ 102res 0.0res/h
【ロボット】トヨタ、米ボストン・ダイナミクスと提携 ロボに生成AI
トヨタ自動車の米研究開発子会社のトヨタ・リサーチ・インスティテュート(TRI)は16日、米ロボット開発のボストン・ダイナミクスと提携すると発表した。ボストン社の汎用ヒト型ロボットに、TRIの生成AI(人工知能)技術...
-
★科学ニュース+ 95res 0.0res/h
【AI】AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表
AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表OpenAIのGPT-4など大規模言語モデル(LLM)をベースにしたAIは、自然な文章を生成したりさまざまな課題をクリアした...
-
★ニュース速報+ 201res 1.6res/h
【AI】「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表★2
米AppleのAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。...
-
★ニュース速報+ 1002res 103res/h
【AI】「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表
米AppleのAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。...
-
★ビジネスニュース+ 20res 0.0res/h
【AI】リコー、モデルマージで“GPT-4レベル”の大規模言語モデル開発
リコーは9月30日、モデルマージ技術によって高性能な日本語大規模言語モデル(LLM)を開発したと発表した。東京工業大学などが開発したLLM「Llama-3-Swallow-70B」をベースにしたAIモデルで、米OpenAIのLLM「GPT-4」と...
-
★科学ニュース+ 29res 0.0res/h
【AI】加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。いくつかの興味深い事象が起きているから...
-
★ニュース速報+ 288res 2.4res/h
日本国産LLM「KARAKURI」が登場、NVIDIAのGPU要らず、ChatGPT-4o越えの性能、低予算で日本語最高性能AIエージェント
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。いくつかの興味深い事象が起きているから...
-
★科学ニュース+ 11res 0.0res/h
【LLM】日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた
日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能AI開発企業のCohereがGPT-4と同等の性能を備えた大規模言語モデル「Command R+...
-
★科学ニュース+ 8res 0.0res/h
【AI】東大ベンチャーELYZA、GPT-3.5 Turboレベルの日本語LLM発表
東大ベンチャーELYZA、GPT-3.5 Turboレベルの日本語LLM発表文● 田口和裕 東京大学松尾研究室発のAIベンチャー「ELYZA」は3月13日、700億パラメーターの最新日本語大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-70...
-
★ニュース速報+ 1002res 214res/h
世界各国が血眼になってGPUを確保する中、とてつもないLLMがリリース、1ビットLLM 全ての推論を加算のみ GPU不要になる可能性も
Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits()」だ。彼らが発表したグラフを引用しよう。画像この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。こ...
-
★科学ニュース+ 78res 0.0res/h
【LLM】1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も
1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も 2月は中国では春節というお正月があり、春節にはみんな休む。それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日...
-
★科学ニュース+ 5res 0.0res/h
【LLM】大規模言語モデルを用いて3Dコンテンツの手続き型モデリングを実現するフレームワーク「3D-GPT」が登場
大規模言語モデルを用いて3Dコンテンツの手続き型モデリングを実現するフレームワーク「3D-GPT」が登場オーストラリアや中国の研究チームが、大規模言語モデルと2Dアニメーションや3DCGの製作ツールであるBlenderを...
-
★科学ニュース+ 42res 0.0res/h
【大学】東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」
東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」東京大学松尾研究室は12月26日、大規模言語モデル(LLM)の研究者や開発エンジニアを募集するとX(旧Twitter)で発表した。...
-
★科学ニュース+ 7res 0.0res/h
【LLM】Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指している
Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指しているAppleの研究者が「LLM in a flash: Efficient Large Language Model Inference with Limited Memory」と題した論文をプレプリントサーバ...
-
★科学ニュース+ 10res 0.0res/h
【LLM】心を読んでテキストに変換する「BrainGPT」が登場、実験の様子がムービーで確認可能
心を読んでテキストに変換する「BrainGPT」が登場、実験の様子がムービーで確認可能2023年12月10日から16日にかけて行われた機械学習と計算論的神経科学のカンファレンスイベント「NeurIPS」において、シドニー工科...
-
★科学ニュース+ 26res 0.0res/h
【AI】LLMを駆使して数理科学問題の新しい解決策を数学者よりも巧みに出力するAIシステム「FunSearch」 Google DeepMind発表
大規模言語モデルを駆使して数理科学問題の新しい解決策を数学者よりも巧みに出力するAIシステム「FunSearch」をGoogle DeepMindが発表 GoogleのAI開発部門であるGoogle DeepMindが、大規模言語モデル(LLM)を利用し...
-
★科学ニュース+ 3res 0.0res/h
【LLM】大規模言語モデルの構造を3Dで視覚化してどんな計算が行われているのかを見やすく表示してくれるサイト「LLM Visualization」
大規模言語モデルの構造を3Dで視覚化してどんな計算が行われているのかを見やすく表示してくれるサイト「LLM Visualization」 ChatGPTなどのチャットAIは、内部で多数の計算を行って文章を生成しています。「LLM Vis...
-
★科学ニュース+ 8res 0.0res/h
【LLM】「医療」に特化したオープンソースの大規模言語モデル「Meditron」が登場
「医療」に特化したオープンソースの大規模言語モデル「Meditron」が登場Metaの大規模言語モデル(LLM)である「Llama 2」をベースに医学書でトレーニングした、医療専門のLLMスイート「Meditron」が登場しました。登...
-
★科学ニュース+ 2res 0.0res/h
【LLM】GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビュー
GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビュー 文章生成AIの研究開発が急速に進んでおり、無料で使える大規模言語モデル(LLM)も数多く公開されています。しかし、...
-
★科学ニュース+ 19res 0.0res/h
【AI】GPT-4は研究論文を査読できるか? Nature等論文約4,800本で検証「LLMは査読にも有用」
GPT-4は研究論文を査読できるか?スタンフォード大らNature等論文約4,800本で検証「LLMは査読にも有用」2023年10月3日、大規模言語モデル(LLM)が研究論文の査読プロセスにどの程度有用であるかを示す研究結果が発表さ...