LLM - 2NN 2ちゃんねるニュース速報＋ナビ

★ビジネスニュース＋ 25/02/03 07:59 69res 0.2res/h

【AI】DeepSeekだけじゃない次に来る中華AIスタートアップ

中国で人工知能(AI)スタートアップが続々と登場している。低コストで高性能な生成AIを発表したDeepSeek(ディープシーク)を筆頭に、月之暗面(Moonshot AI)なども力を付けている。ネット大手の資金や学術機関の人材が...

日本経済新聞 Posted by ムヒタ ★ 2NNのURL
★科学ニュース＋ 25/01/30 21:12 4res 0.0res/h

【AI】DeepSeek-R1がNPU上で動作できるようMicrosoftが移植

DeepSeek-R1がNPU上で動作できるようMicrosoftが移植Microsoftは29日(米国時間)、Copilot+ PCに搭載されているNPU上でLLMを活用できるDeepSeek-R1モデルの移植を行なったと発表した。まずは「Visual Studio Code」(V...

PC Watch Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 25/01/27 22:37 65res 0.1res/h

【ナゾロジー】AIも「痛み」や「快楽」に屈して任務を放棄する

AIも「痛み」や「快楽」に屈して任務を放棄する人工知能が、私たち人間と同じように「痛み」や「快楽」を経験する可能性はあるのでしょうか。チャットボットや画像生成AIの登場で「AIがまるで意識を持っているかのよ...

nazology.kusuguru.co.jp Posted by すらいむ ★ 2NNのURL
★ニュース速報＋ 25/01/27 14:02 872res 7.2res/h

【ITmedia】米OpenAIに匹敵する話題の中華LLM「DeepSeek R1」天安門事件を説明できるかあれこれ質問してみた結果

話題の中華LLM「DeepSeek R1」は、天安門事件を説明できるか　あれこれ質問した1月20日(日本時間)に突如登場し、AIユーザー・開発者たちの話題をさらった大規模言語モデル(LLM)「DeepSeek-R1」。特徴は、分野によっ...

ITmedia Posted by お断り ★ 2NNのURL
★科学ニュース＋ 24/12/25 21:03 9res 0.0res/h

【AI】AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例

AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例大規模言語モデル(LLM)を用いたAIは、驚くほど自然な文章やリアルな画像を生成できる能力を備えている一方で、危険なことに回答し...

GIGAZINE Posted by すらいむ ★ 2NNのURL
★ニュース速報＋ 24/12/16 17:26 894res 7.4res/h

【IT】ついにAI学習のためのデータが枯渇へ、データセット不足のAI企業は大規模で汎用的なLLMから専門性の高いモデルへ移行か

AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。...

GIGAZINE Posted by 牛乳トースト ★ 2NNのURL
★科学ニュース＋ 24/12/09 23:19 2res 0.0res/h

【IT】「Xのアルゴリズム」は数日であなたの政治的意見を変えられる――米スタンフォード大が1000人以上で検証

「Xのアルゴリズム」は数日であなたの政治的意見を変えられる――米スタンフォード大が1000人以上で検証米スタンフォード大学などに所属する研究者らが発表した論文「Social Media Algorithms Can Shape Affective P...

ITmedia Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 24/11/17 18:57 7res 0.0res/h

【AI】LLMの概念空間の構造解明:脳のような機能別「領域」仮説 MITの研究チームが発表

LLMの概念空間の構造解明:脳のような機能別「領域」仮説　MITの研究チームが発表 MITの研究者らは2024年10月10日、スパース・オートエンコーダー(SAE)技術を用いて、大規模言語モデル(LLM)の内部に潜む構造を解明す...

ledge.ai Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 24/11/07 23:23 22res 0.0res/h

【AI】朝日新聞社のLLM評価手法論文、国際学会EMNLPで採択・・・AI応答に含まれる嘘の低減につながる研究

朝日新聞社のLLM評価手法論文、国際学会EMNLPで採択・・・AI応答に含まれる嘘の低減につながる研究株式会社朝日新聞社は、同社のメディア研究開発センター員である川畑輝氏が主著した論文が、自然言語処理分野におけ...

media-innovation.jp Posted by すらいむ ★ 2NNのURL
★ニュース速報＋ 24/10/14 00:01 201res 1.6res/h

【AI】「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表★2

米AppleのAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。...

ITmedia Posted by 香味焙煎 ★ 2NNのURL
★ニュース速報＋ 24/10/13 08:17 1002res 103res/h

【AI】「現在のLLMに真の推論は困難」──Appleの研究者らが論文発表

米AppleのAI研究者らは10月7日(現地時間)、「GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models」(LLMにおける数学的推論の限界を理解する)という論文を発表した。...

ITmedia Posted by 香味焙煎 ★ 2NNのURL
★科学ニュース＋ 24/06/22 21:32 29res 0.0res/h

【AI】加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実

加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。いくつかの興味深い事象が起きているから...

WirelessWire News Posted by すらいむ ★ 2NNのURL
★ニュース速報＋ 24/06/22 01:04 288res 2.4res/h

日本国産LLM「KARAKURI」が登場、NVIDIAのGPU要らず、ChatGPT-4o越えの性能、低予算で日本語最高性能AIエージェント

加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。いくつかの興味深い事象が起きているから...

WirelessWire News Posted by お断り ★ 2NNのURL
★科学ニュース＋ 24/04/08 23:21 11res 0.0res/h

【LLM】日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた

日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能AI開発企業のCohereがGPT-4と同等の性能を備えた大規模言語モデル「Command R+...

GIGAZINE Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 24/03/13 23:36 8res 0.0res/h

【AI】東大ベンチャーELYZA、GPT-3.5 Turboレベルの日本語LLM発表

東大ベンチャーELYZA、GPT-3.5 Turboレベルの日本語LLM発表文● 田口和裕東京大学松尾研究室発のAIベンチャー「ELYZA」は3月13日、700億パラメーターの最新日本語大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-70...

ASCII.jp Posted by すらいむ ★ 2NNのURL
★ニュース速報＋ 24/02/29 16:34 1002res 214res/h

世界各国が血眼になってGPUを確保する中、とてつもないLLMがリリース、1ビットLLM 全ての推論を加算のみ GPU不要になる可能性も

Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits()」だ。彼らが発表したグラフを引用しよう。画像この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。こ...

goo ニュース Posted by お断り ★ 2NNのURL
★科学ニュース＋ 24/02/28 23:09 78res 0.0res/h

【LLM】1ビットLLMの衝撃! 70Bで8.9倍高速全ての推論を加算のみで!GPU不要になる可能性も

1ビットLLMの衝撃! 70Bで8.9倍高速　全ての推論を加算のみで!GPU不要になる可能性も 2月は中国では春節というお正月があり、春節にはみんな休む。それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日...

WirelessWire News Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 23/12/29 21:35 5res 0.0res/h

【LLM】大規模言語モデルを用いて3Dコンテンツの手続き型モデリングを実現するフレームワーク「3D-GPT」が登場

大規模言語モデルを用いて3Dコンテンツの手続き型モデリングを実現するフレームワーク「3D-GPT」が登場オーストラリアや中国の研究チームが、大規模言語モデルと2Dアニメーションや3DCGの製作ツールであるBlenderを...

GIGAZINE Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 23/12/26 22:06 42res 0.0res/h

【大学】東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集「LLM研究をさらに加速させる」

東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集　「LLM研究をさらに加速させる」東京大学松尾研究室は12月26日、大規模言語モデル(LLM)の研究者や開発エンジニアを募集するとX(旧Twitter)で発表した。...

ITmedia Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 23/12/22 19:45 7res 0.0res/h

【LLM】Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指している

Appleは大規模言語モデルをiPhone上でローカルに動作させることを目指しているAppleの研究者が「LLM in a flash: Efficient Large Language Model Inference with Limited Memory」と題した論文をプレプリントサーバ...

GIGAZINE Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 23/12/18 21:52 10res 0.0res/h

【LLM】心を読んでテキストに変換する「BrainGPT」が登場、実験の様子がムービーで確認可能

心を読んでテキストに変換する「BrainGPT」が登場、実験の様子がムービーで確認可能2023年12月10日から16日にかけて行われた機械学習と計算論的神経科学のカンファレンスイベント「NeurIPS」において、シドニー工科...

GIGAZINE Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 23/12/15 20:32 26res 0.0res/h

【AI】LLMを駆使して数理科学問題の新しい解決策を数学者よりも巧みに出力するAIシステム「FunSearch」 Google DeepMind発表

大規模言語モデルを駆使して数理科学問題の新しい解決策を数学者よりも巧みに出力するAIシステム「FunSearch」をGoogle DeepMindが発表 GoogleのAI開発部門であるGoogle DeepMindが、大規模言語モデル(LLM)を利用し...

GIGAZINE Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 23/12/04 20:58 3res 0.0res/h

【LLM】大規模言語モデルの構造を3Dで視覚化してどんな計算が行われているのかを見やすく表示してくれるサイト「LLM Visualization」

大規模言語モデルの構造を3Dで視覚化してどんな計算が行われているのかを見やすく表示してくれるサイト「LLM Visualization」 ChatGPTなどのチャットAIは、内部で多数の計算を行って文章を生成しています。「LLM Vis...

GIGAZINE Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 23/12/04 20:35 8res 0.0res/h

【LLM】「医療」に特化したオープンソースの大規模言語モデル「Meditron」が登場

「医療」に特化したオープンソースの大規模言語モデル「Meditron」が登場Metaの大規模言語モデル(LLM)である「Llama 2」をベースに医学書でトレーニングした、医療専門のLLMスイート「Meditron」が登場しました。登...

GIGAZINE Posted by すらいむ ★ 2NNのURL
★科学ニュース＋ 23/12/02 22:56 2res 0.0res/h

【LLM】GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビュー

GPU非搭載ノートPCでもコマンド不要で各種言語モデルの性能を試せる実行環境「LM Studio」レビュー文章生成AIの研究開発が急速に進んでおり、無料で使える大規模言語モデル(LLM)も数多く公開されています。しかし、...

GIGAZINE Posted by すらいむ ★ 2NNのURL