スポンサーリンク

ChatGPTとかClaudeにハマってる奴は浅いよな。本物はローカルLLMに手を出す

adsense



1名無しさんID:ID:nV1JlLSM0 [2026/04/06(月) 21:27:04.78]
今は時期が良いぞ

https://greta.5ch.net/test/read.cgi/poverty/


2名無しさんID:ID:u+vRmF0N0 [2026/04/06(月) 21:28:54.49]
思考モードの制限も当然無いか
でもお時間かかるんでしょう??


7名無しさんID:ID:uDQ07jun0 [2026/04/06(月) 21:32:25.75]
>>2
(数百万クラスのPCなら)ちょっと3秒くらい考えればできると思いますよ


8名無しさんID:ID:u+vRmF0N0 [2026/04/06(月) 21:33:00.86]
>>7
5万や無理やな


3名無しさんID:ID:hwsPFCur0 [2026/04/06(月) 21:29:28.03]
今マジで熱いよな


5名無しさんID:ID:9CTKNtdK0 [2026/04/06(月) 21:31:39.51]
H200を1枚買うだけで600万かかるやん


6名無しさんID:ID:OfIn8ExW0 [2026/04/06(月) 21:32:21.97]
bonsaiってのがすごいらしいな


122名無しさんID:ID:D5acMv4X0 [2026/04/08(水) 03:46:05.05]
>>6
よくあれだけ圧縮できたよな
リソース1/8くらいなのに去年より性能いいし


9名無しさんID:ID:Z/j200OV0 [2026/04/06(月) 21:33:56.07]
ollama使ったけどいまいちだった


12名無しさんID:ID:iXABkj3b0 [2026/04/06(月) 21:34:55.28]
>>9
モデルによるやろ


10名無しさんID:ID:3szK9BcT0 [2026/04/06(月) 21:34:05.41]
ローカルで30Bくらいが動けば十分


11名無しさんID:ID:iXABkj3b0 [2026/04/06(月) 21:34:36.96]
遅くてストレスあるわ、エージェントとして裏で作業させるにはいいけどチャット用途は契約したほうがいい


13名無しさんID:ID:EBhQeWMCM [2026/04/06(月) 21:35:20.69]
オンラインの方が早いから制限解除とかセキュリティとかのメリットしか無いな


15名無しさんID:ID:mGhc7ijS0 [2026/04/06(月) 21:35:48.36]
会社のDC休日は私用で使っていいことになってて遊ばせて貰ってるわ
エロ画像生成してるやつも居たらしくて休日中に痕跡を消しとけとやんわり通達出てたのには笑った


16名無しさんID:ID:TxPM6ZZu0 [2026/04/06(月) 21:36:03.89]
遅い?ローカルの回答めっちゃ早くない?


17名無しさんID:ID:1BpEwv2Z0 [2026/04/06(月) 21:36:47.53]
GMKtec EVO-X2
メモリ128GB
去年30万で買った。


20名無しさんID:ID:ZUZ7CN9g0 [2026/04/06(月) 21:39:48.61]
RTX PRO 6000 Blackwellでコンテキスト長MAXで動かしてる動画ないのかな?


21名無しさんID:ID:DT2tQ9YD0 [2026/04/06(月) 21:40:57.97]
まあトランスフォーマーの仕組みの汎用性の高さに気づいてからが本番ではある


22名無しさんID:ID:3KL/f/FN0 [2026/04/06(月) 21:42:00.86]
gemma4 26bのコーディング性能ってどうなん?
GPUは16GBしかないけどいける?


23名無しさんID:ID:pwNj6l3q0 [2026/04/06(月) 21:42:23.14]
Gemma4はなかなか凄いとは思うけど
結局クラウドには勝てないから一昔前のPCベンチマーク代わりとか物好きの趣味レベルよな
別にgeminiでもclaudeでもエロ用途だろうがそこそこ緩いし
Gemma4が一般的なPCでも動く時代になったら夢が広がるが





24名無しさんID:ID:OFcUZ415H [2026/04/06(月) 21:42:31.09]
ローカルエージェントで遊びたい


25名無しさんID:ID:of4G6S5n0 [2026/04/06(月) 21:43:47.09]
コーディングさせるには無理がある


26名無しさんID:ID:w5vrw0y70 [2026/04/06(月) 21:45:47.78]
個人レベルじゃ知恵遅れ程度の性能しか出ない印象なんだが最近は違うのか?


27名無しさんID:ID:uOQeMzyu0 [2026/04/06(月) 21:51:14.93]
ローカルで満足のいく返答を得るコストが高すぎ


28名無しさんID:ID:xYNO0lNt0 [2026/04/06(月) 21:52:57.76]
WormGPT…


29名無しさんID:ID:Mz3Ub3JX0 [2026/04/06(月) 21:54:31.16]
Gemma4のE4Bしか使えないゴミPCだけど漫画50枚読み込ませて内容説明出来た
特に使い道ないからそれで終わったけどな
普段遣いならチャッピーでいいし


30名無しさんID:ID:Phto8v490 [2026/04/06(月) 21:56:25.79]
ローカルllmって性能的にchatgptとかclaudeとかに全く及ばない
llmそのものに興味があって実験とかしたい人にはいいけど、それ以外は意味ない


31名無しさんID:ID:DZ+V/pWz0 [2026/04/06(月) 21:56:56.70]
Rimtalkで使ってる
無制限に出来るから助かるわ


32名無しさんID:ID:TqsWpkHS0 [2026/04/06(月) 21:59:11.99]
Mac Studioとか中途半端で使い道無かったけど
クラスター化できる機能で化けたな


34名無しさんID:ID:J1vZRqsM0 [2026/04/06(月) 21:59:25.19]
コーティングエージェントで使うにはまだ能力が足らない


36名無しさんID:ID:8d57VjZy0 [2026/04/06(月) 22:01:46.47]
いいねぇ


37名無しさんID:ID:IsvfVXsR0 [2026/04/06(月) 22:01:51.02]
蔵人を評価してるけど最近の双子座(ジェミニ)は賢さが蔵人に追いついてきたな
GPTはお世辞や陰謀論を言うからダメ
蔵人はツンツンして媚びないから良い


38名無しさんID:ID:Mz3Ub3JX0 [2026/04/06(月) 22:05:26.38]
微妙に違うけど画像整理でAIタガー使っててwd14タガーからcamieタガーに変えたら収録キャラが大幅に増えて名無しの画像整理が捗ったわ


39名無しさんID:ID:g2FB/za60 [2026/04/06(月) 22:05:32.73]
ローカル無能過ぎて回帰までがセット


41名無しさんID:ID:PnjV47qd0 [2026/04/06(月) 22:07:22.21]
だったらローカルLLMを使うべき理由を分かりやすく提示してくれ
例えばGemini 3.1 Flash Liteと同等以上の性能を出そうとしたら、Flash Liteよりコストかかるのでは?


42名無しさんID:ID:OFcUZ415H [2026/04/06(月) 22:09:03.41]
一般的な構成だとo3miniくらいらしい


43名無しさんID:ID:Rrid3VrT0 [2026/04/06(月) 22:10:29.19]
ローカルLLMの脆弱性を知らない奴はモグリ


44名無しさんID:ID:fnyhML6n0 [2026/04/06(月) 22:16:26.61]
ローカルLLM勢ってメインメモリ90GB以上積んでて当然みたいなイメージ
5090持ってるけどメインメモリ32GBしかないから無理そうだわ


46名無しさんID:ID:Z34Ha99Q0 [2026/04/06(月) 22:24:57.69]
最近の有料AIはなにか画期的なことが出来ることを売りにしてるんじゃなくて、ベンチマークのグラフや数字を自慢してるだけだから終わってる


47名無しさんID:ID:h3+b3a3g0 [2026/04/06(月) 22:27:08.55]
いやちょっと知恵借りる程度ならお金払うじゃん?

タクシーとかバスとか否定するタイプ?





48名無しさんID:ID:Q4fAXoB30 [2026/04/06(月) 22:27:47.00]
ローカルLLMってVRAM12GBじゃ人権無い感じ?
Q4とかでも17GBが最低ラインやん?


50名無しさんID:ID:Z34Ha99Q0 [2026/04/06(月) 22:30:41.15]
>>48
普通にそのへんが多数派だろ
3090はともかく4090や5090の頃にはGPUが値上がりしまくってるから掲示板で型番連呼するやつはたくさんいても実数はいないはず


49名無しさんID:ID:BclCYiQS0 [2026/04/06(月) 22:30:23.22]
ローカルで脱獄(エロとか調教されていない版)があるという噂も


52名無しさんID:ID:5sGUdU4mH [2026/04/06(月) 22:34:50.06]
数十万のpcでローカルllmするぐらいならopwnrouterの無料で十分じゃないの?


53名無しさんID:ID:Z34Ha99Q0 [2026/04/06(月) 22:42:13.95]
>>52
Macminiも3060あたりのデスクトップPCも高騰してない時期だったら10-14くらいで他のビジネス用PCと大差ない値段でそれを流用してる人のほうが多いだろう
LLM専用に50万も60万も予算つかってPCを新調したりGPU抽選に参加してる人らはニュースにはなっても実際の数としては例外的割合のはず


54名無しさんID:ID:YolcrfaB0 [2026/04/06(月) 22:42:27.16]
翻訳させるには何がいいの


55名無しさんID:ID:t67e6ol+0 [2026/04/06(月) 23:47:47.12]
5080、メモリ128GBでエロ漫画のプロット書ける?
Geminiよりええんか?


56名無しさんID:ID:0ncPdbG+0 [2026/04/06(月) 23:53:31.57]
DGX Sparkでローカルllm使ってるケンモメンおらんの?


58名無しさんID:ID:BclCYiQS0 [2026/04/06(月) 23:55:33.29]
60万円コースかぁ


59名無しさんID:ID:2uhlsoAF0 [2026/04/07(火) 00:31:43.18]
もとを取った頃には廃棄処分なんだろなサーバー


61名無しさんID:ID:2DFmkfMO0 [2026/04/07(火) 00:44:31.57]
qwen3.5の9bでオープンクロー動かしたら小学生低学年並みのヤバさだったぞ。
GPT5.4クラスが動かんとキツい。


62名無しさんID:ID:wijWtmUC0 [2026/04/07(火) 00:44:40.87]
ゲームがん無視で4060ti(16GB)が売れてた理由がようやく判明したな
ローカルか


63名無しさんID:ID:3TcPZRgR0 [2026/04/07(火) 00:49:47.65]
Qwen Image Rapid AIOは凄いよ
嫌儲で拾った画像の女を片っ端から脱がせられる


66名無しさんID:ID:90eqlhcx0 [2026/04/07(火) 01:02:48.16]
chatGPTはオワコンになる前にエロ解禁してよ


67名無しさんID:ID:ZZ7IObki0 [2026/04/07(火) 01:18:17.95]
使いもんなんねーよ


68名無しさんID:ID:1r3eOrjN0 [2026/04/07(火) 01:21:18.31]
gpu必須だよな
メモリやcpuだけだとどうにもならん感じか


69名無しさんID:ID:XSNwd2fCM [2026/04/07(火) 01:22:58.91]
突如実用化した1ビットLLM Bonsai-8B もう推論にGPUはほぼ不要になる。その先に何が起きるか

https://wirelesswire.jp/2026/04/93202/


71名無しさんID:ID:q8lUMFJP0 [2026/04/07(火) 06:13:26.18]
大学や研究所とかでは48GB以上のGPUを使ってあれこれ新しい技術にチャレンジしている人達が、
ローカルで動かしたい人向けに頑張ってくれて動かせるようになるラインが16GBぐらいの印象


72名無しさんID:ID:En1QkVXg0 [2026/04/07(火) 06:29:19.92]
AI用に5090欲しい
でも60万円は無理だお


73名無しさんID:ID:uoukHTDX0 [2026/04/07(火) 06:33:16.90]
良くわからん
ネットから情報集めまくってAIがこねくり回して何かを作るんだろ?
ローカルってオフライン?自分のパソコンの中だけで完結するなら情報足りなくて大したものできないんじゃないの?
素人からしたらそう思うんだが
ちがうのん?





82名無しさんID:ID:q8lUMFJP0 [2026/04/07(火) 09:34:36.91]
>>73
その通り。
でも情報足りないけれど公開されたサービスでは抑止されているエロ用途とかに使える


74名無しさんID:ID:AWjBEzrH0 [2026/04/07(火) 06:33:33.69]
大ロシア幼女横キック


75名無しさんID:ID:XeR+jU3hH [2026/04/07(火) 07:09:18.57]
3060を2枚 pcie x8 x2でも4090よりちょっと遅いくらいだから5090を2枚とかにする気がないならIntelやRadeonの16G2枚から入ればいいんじゃないかな


77名無しさんID:ID:9Ky29+jnd [2026/04/07(火) 07:20:11.17]
エロ画像生成ならローカル一択だけど推論目的で使うのは大容量VRAM必須だから微妙じゃね


78名無しさんID:ID:rjdc4ElI0 [2026/04/07(火) 07:25:36.87]
余ったゲーミングPCで音楽と動画の生成やってるけどおもちゃとしては十分だね


79名無しさんID:ID:yv+sTwPp0 [2026/04/07(火) 07:43:35.10]
Macでもいける?


80名無しさんID:ID:ZZiLLgBe0 [2026/04/07(火) 07:50:08.47]
遅くないとか言ってるのは思考してないモードだからだと理解してない
そもそもchatgptやgeminiのシンキングモードと高速モードの差も理解して無さそう


83名無しさんID:ID:19+Wuu0B0 [2026/04/07(火) 11:56:16.65]
gemma4-31B凄すぎる
特にgeminiapiの無料枠で一日1500回使えるのが頭がおかしい
当然のことながらredditに同じ事を考えてる奴が居てAIエージェントで複垢で無料枠限界まで使ってる奴がいた
こりゃ早晩規制キツくなるな


84名無しさんID:ID:Cdhmkyev0 [2026/04/07(火) 12:31:51.34]
実際ローカルで揃えようとすると月20ドルがいかに安いかがよくわかる


85名無しさんID:ID:3nCpT96w0 [2026/04/07(火) 12:38:03.41]
iPhoneにgemma4入れたけど動くの確認しただけで満足してしまった


88名無しさんID:ID:q8lUMFJP0 [2026/04/07(火) 12:51:18.41]
gemma4は脱獄版が話題になっているね
x.com/i/status/2040605292971315328


89名無しさんID:ID:cq90qv45r [2026/04/07(火) 12:54:03.67]
claude codeは代替先がない


91名無しさんID:ID:19+Wuu0B0 [2026/04/07(火) 16:42:32.41]
なんかミラ・ジョヴォヴィッチがエージェントAI用のメモリシステムを開発メンバーだとかのニュースが流れて来たのを確かめたら本当だった
まあスポンサーとしてお金を出したとかなのかもしれんが


92名無しさんID:ID:7EChlGVx0 [2026/04/07(火) 16:45:09.61]
いくら性能上がっても所詮はオンラインより低性能だなら需要がないんでしょ
毎月課金したくないのに先に数十万払う本末転倒だし
元々ガン積みなゲーミングとかワークステーション持ってる奴ならいいけどそんな奴は少ない
俺もVRAM24GBにRAM200GBくらいはあるけどあんまり使ってない


114名無しさんID:ID:5Dzm9zqh0 [2026/04/08(水) 02:50:58.61]
>>92 >>93
>>93

翻訳・要約・写真分析・雑学質問程度だったらローカルで足りる
プログラムや小説みたいな仕事で使ってる人はその性能では困るのだろうけど
日常や趣味レベルで毎月何千円も出したくない


93名無しさんID:ID:Y2wMVTmg0 [2026/04/07(火) 17:49:49.23]
少し性能が低いんじゃなくて、大幅に性能が低い上に、
モデルの更新も遅いから、新しい情報を知らないうえに、ウェブ検索も難しいんで、ハルシネーションが起きまくる
ローカルllmは相当限られた用途でしか使えない


94名無しさんID:ID:9fKggh01M [2026/04/07(火) 17:50:45.60]
QWEN3.5の無制限版にイケない質問したら震えたわ
これはローカルでしかできないヤバさだよな


95名無しさんID:ID:Y2wMVTmg0 [2026/04/07(火) 18:09:22.33]
qwenに天安門事件とか尖閣諸島について聞いてみればいい
結局llmってオープンと言っても、モデルが利用できるだけで、自分でモデルを改良するのはできないというか、ほぼできない


97名無しさんID:ID:9KVbedqF0 [2026/04/07(火) 20:02:51.30]
>>95
qwen3.5のuncensored(検閲なし)版出回ってるぞ


96名無しさんID:ID:448eBcR30 [2026/04/07(火) 18:15:41.34]
Qwen3.5は確かに凄いんだけど、これでAIエージェントできないのがなぁ
Continue使っても出来ることは限られてるし





98名無しさんID:ID:rxhzXqgrM [2026/04/07(火) 20:12:44.83]
qwen3.5のuncensored使ってるけど
たしかにNSFWなことも生成してくれるが
非NSFWなほうに振ろうとする努力も垣間見えてイケイケな感じじゃないんだよな


99名無しさんID:ID:5niQxFtHM [2026/04/07(火) 20:27:07.31]
Qwenは画像の日本語読みが優秀


100名無しさんID:ID:LQq1oU8R0 [2026/04/07(火) 20:33:23.35]
glm5でVRAM 800GB


101名無しさんID:ID:fI4tOJOS0 [2026/04/07(火) 23:52:14.72]
4Bとかたまごっちみたいな育成ゲームだと思ってる(´・ω・`)


102名無しさんID:ID:OnzH8Tcx0 [2026/04/08(水) 01:08:45.40]
ローカルLLMなんて安倍晋三小説を書くくらいしか使い道がないだろ


104名無しさんID:ID:X8+rlA1X0 [2026/04/08(水) 02:15:31.30]
フラックス入れたけどコミュファイとかいうのが意味不明すぎて
画像作れてないんだが。


105名無しさんID:ID:X8+rlA1X0 [2026/04/08(水) 02:17:58.81]
クウェンもリリース直後はバグ動作しまくってたしgemma4ももう少し待った方が良い。


107名無しさんID:ID:4hLINwn30 [2026/04/08(水) 02:25:23.13]
notebooklmって簡易ragの一種に過ぎない
ナレッジの追加はclaudeやchatgptのプロジェクトやgptsでもできる


109名無しさんID:ID:4hLINwn30 [2026/04/08(水) 02:32:05.08]
大差ないよ
要するに推論する時に外部ナレッジを検索てしるだけ
どの生成aiサービスでもやってることは同じ
使い勝手の違い程度しかないし、使い勝手ならプロジェクト作れてgptsでオリジナルのチャットボット作れるchatgptがいい


110名無しさんID:ID:lsK2+Kk60 [2026/04/08(水) 02:36:08.57]
gemma4-26b-a4b弄ってるけどgeminiの高速モードくらいには使えるのがすごい
VRAM16Gで動くローカルLLMでこれってすごい時代になったなぁと感心してる
あと検閲が全くと言っていいくらい効いてないのも凄い


112名無しさんID:ID:HJm6elMZH [2026/04/08(水) 02:42:21.21]
エロ絵とプログラムの人ですごい温度差が


113名無しさんID:ID:4hLINwn30 [2026/04/08(水) 02:46:36.95]
どの生成aiにもメモリー機能はある


117名無しさんID:ID:oO7fLCvY0 [2026/04/08(水) 03:08:57.68]
gemmaが4bの次26bなんだけど
4bさすがに頭よくないし間を出せや

qwenってclaude入ってる9bより27bのckaude無しiq2の方が賢くね?


119名無しさんID:ID:oR+zexDt0 [2026/04/08(水) 03:19:01.04]
>>117
小説書かせると26B A4Bより31Bの方が明らかに頭良くて31Bよりもうちょっと上のが欲しいったなるわ


125名無しさんID:ID:oR+zexDt0 [2026/04/08(水) 04:23:20.64]
Gemma 4は英語のコミック画像を翻訳させると読み取りも翻訳(意訳)の精度が大分高いなって感じる
エロ小説も指示通り作ってくれるけどこっちは文章が堅いというかGeminiっぽさがあって抜ける文章の域まで達していないかんじ


127名無しさんID:ID:DJmAA+kU0 [2026/04/08(水) 07:49:56.21]
コーディングエージェントで日本語プロンプトに対応できんの?


129名無しさんID:ID:IFdWwvp80 [2026/04/08(水) 12:43:50.07]
NotebookLM連携は単純なベクトル検索、キーワード検索だけじゃなくて、データの構造化、要約、生成によるクエリ検索までやってると言われてるね
要はNotebookLMに入れたデータのデータベース化も自動的にやって、そこにgeminiがアクセスする形になってる
googleのマネ―パワーよ

出典:https://greta.5ch.io/test/read.cgi/poverty/1775478424/