「LLM」のニュース一覧
-
★ニュース速報+ 46res 6.0res/h
NVIDIA RTX 5080、RTX 4090 に性能及ばず 生成AI
RTX 4080 SUPERやRadeon RX 7900 XTXには勝てるのだけど…… GeForce RTX 5080、RTX 4090に下剋上ならず画像CGレンダリングでもRTX 4090には勝てず…… CGレンダリング系のテストは、「Blender Benchmark」と「V-Ray...
-
★科学ニュース+ 4res 0.0res/h
【AI】DeepSeek-R1がNPU上で動作できるようMicrosoftが移植
DeepSeek-R1がNPU上で動作できるようMicrosoftが移植Microsoftは29日(米国時間)、Copilot+ PCに搭載されているNPU上でLLMを活用できるDeepSeek-R1モデルの移植を行なったと発表した。まずは「Visual Studio Code」(V...
-
★ニュース速報+ 414res 6.0res/h
【速報】イタリア、DeepSeekのダウンロード不可に 個人情報の取り扱いで説明求める
イタリア、DeepSeekのダウンロード不可に 説明を要請イタリアのデータ保護当局(ガランテ)は29日、中国の新興企業、DeepSeek(ディープシーク)が開発した生成人工知能(AI)サービスを巡り、個人情報の取り扱いについて...
-
★科学ニュース+ 65res 0.5res/h
【ナゾロジー】AIも「痛み」や「快楽」に屈して任務を放棄する
AIも「痛み」や「快楽」に屈して任務を放棄する人工知能が、私たち人間と同じように「痛み」や「快楽」を経験する可能性はあるのでしょうか。チャットボットや画像生成AIの登場で「AIがまるで意識を持っているかのよ...
-
★ニュース速報+ 872res 7.2res/h
【ITmedia】米OpenAIに匹敵する話題の中華LLM「DeepSeek R1」天安門事件を説明できるか あれこれ質問してみた結果
話題の中華LLM「DeepSeek R1」は、天安門事件を説明できるか あれこれ質問した1月20日(日本時間)に突如登場し、AIユーザー・開発者たちの話題をさらった大規模言語モデル(LLM)「DeepSeek-R1」。特徴は、分野によっ...
-
★科学ニュース+ 9res 0.0res/h
【AI】AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例
AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例大規模言語モデル(LLM)を用いたAIは、驚くほど自然な文章やリアルな画像を生成できる能力を備えている一方で、危険なことに回答し...
-
★ニュース速報+ 894res 7.4res/h
【IT】ついにAI学習のためのデータが枯渇へ、データセット不足のAI企業は大規模で汎用的なLLMから専門性の高いモデルへ移行か
AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。...
-
★科学ニュース+ 2res 0.0res/h
【IT】「Xのアルゴリズム」は数日であなたの政治的意見を変えられる――米スタンフォード大が1000人以上で検証
「Xのアルゴリズム」は数日であなたの政治的意見を変えられる――米スタンフォード大が1000人以上で検証米スタンフォード大学などに所属する研究者らが発表した論文「Social Media Algorithms Can Shape Affective P...
-
★科学ニュース+ 7res 0.0res/h
【AI】LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表
LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表 MITの研究者らは2024年10月10日、スパース・オートエンコーダー(SAE)技術を用いて、大規模言語モデル(LLM)の内部に潜む構造を解明す...
-
★科学ニュース+ 22res 0.0res/h
【AI】朝日新聞社のLLM評価手法論文、国際学会EMNLPで採択・・・AI応答に含まれる嘘の低減につながる研究
朝日新聞社のLLM評価手法論文、国際学会EMNLPで採択・・・AI応答に含まれる嘘の低減につながる研究株式会社朝日新聞社は、同社のメディア研究開発センター員である川畑輝氏が主著した論文が、自然言語処理分野におけ...
-
★ビジネスニュース+ 102res 0.0res/h
【ロボット】トヨタ、米ボストン・ダイナミクスと提携 ロボに生成AI
トヨタ自動車の米研究開発子会社のトヨタ・リサーチ・インスティテュート(TRI)は16日、米ロボット開発のボストン・ダイナミクスと提携すると発表した。ボストン社の汎用ヒト型ロボットに、TRIの生成AI(人工知能)技術...
-
★ニュース速報+ 201res 1.6res/h
【AI】「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表★2
米AppleのAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。...
-
★ニュース速報+ 1002res 103res/h
【AI】「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表
米AppleのAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。...
-
★科学ニュース+ 29res 0.0res/h
【AI】加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。いくつかの興味深い事象が起きているから...
-
★ニュース速報+ 288res 2.4res/h
日本国産LLM「KARAKURI」が登場、NVIDIAのGPU要らず、ChatGPT-4o越えの性能、低予算で日本語最高性能AIエージェント
加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。いくつかの興味深い事象が起きているから...
-
★科学ニュース+ 11res 0.0res/h
【LLM】日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた
日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能AI開発企業のCohereがGPT-4と同等の性能を備えた大規模言語モデル「Command R+...
-
★科学ニュース+ 8res 0.0res/h
【AI】東大ベンチャーELYZA、GPT-3.5 Turboレベルの日本語LLM発表
東大ベンチャーELYZA、GPT-3.5 Turboレベルの日本語LLM発表文● 田口和裕 東京大学松尾研究室発のAIベンチャー「ELYZA」は3月13日、700億パラメーターの最新日本語大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-70...
-
★ニュース速報+ 1002res 214res/h
世界各国が血眼になってGPUを確保する中、とてつもないLLMがリリース、1ビットLLM 全ての推論を加算のみ GPU不要になる可能性も
Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits()」だ。彼らが発表したグラフを引用しよう。画像この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。こ...
-
★科学ニュース+ 78res 0.0res/h
【LLM】1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も
1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も 2月は中国では春節というお正月があり、春節にはみんな休む。それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日...
-
★科学ニュース+ 5res 0.0res/h
【LLM】大規模言語モデルを用いて3Dコンテンツの手続き型モデリングを実現するフレームワーク「3D-GPT」が登場
大規模言語モデルを用いて3Dコンテンツの手続き型モデリングを実現するフレームワーク「3D-GPT」が登場オーストラリアや中国の研究チームが、大規模言語モデルと2Dアニメーションや3DCGの製作ツールであるBlenderを...
-
★科学ニュース+ 42res 0.0res/h
【大学】東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」
東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」東京大学松尾研究室は12月26日、大規模言語モデル(LLM)の研究者や開発エンジニアを募集するとX(旧Twitter)で発表した。...
-
★科学ニュース+ 7res 0.0res/h
【LLM】Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指している
Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指しているAppleの研究者が「LLM in a flash: Efficient Large Language Model Inference with Limited Memory」と題した論文をプレプリントサーバ...
-
★科学ニュース+ 10res 0.0res/h
【LLM】心を読んでテキストに変換する「BrainGPT」が登場、実験の様子がムービーで確認可能
心を読んでテキストに変換する「BrainGPT」が登場、実験の様子がムービーで確認可能2023年12月10日から16日にかけて行われた機械学習と計算論的神経科学のカンファレンスイベント「NeurIPS」において、シドニー工科...
-
★科学ニュース+ 26res 0.0res/h
【AI】LLMを駆使して数理科学問題の新しい解決策を数学者よりも巧みに出力するAIシステム「FunSearch」 Google DeepMind発表
大規模言語モデルを駆使して数理科学問題の新しい解決策を数学者よりも巧みに出力するAIシステム「FunSearch」をGoogle DeepMindが発表 GoogleのAI開発部門であるGoogle DeepMindが、大規模言語モデル(LLM)を利用し...
-
★科学ニュース+ 3res 0.0res/h
【LLM】大規模言語モデルの構造を3Dで視覚化してどんな計算が行われているのかを見やすく表示してくれるサイト「LLM Visualization」
大規模言語モデルの構造を3Dで視覚化してどんな計算が行われているのかを見やすく表示してくれるサイト「LLM Visualization」 ChatGPTなどのチャットAIは、内部で多数の計算を行って文章を生成しています。「LLM Vis...