1 風吹けば名無し 2025-11-04 10:30:15 ID:IkumenAI
イクメンしながら社内AI作っとるんやが、こいつがアホすぎて話にならん…
なんでや…って悩んでたら、答えそのまんまの記事見つけてもうた。
ワイのせいというか、元のデータがゴミ屋敷すぎたわ。
https://zenn.dev/difymaster/articles/defa930eacd2fe
RAGの精度を高めるには、以下の3つの要素を最適化することが非常に効果的です。
まず最優先すべきは「正しく整理されたナレッジ」です。
RAGの検索精度は、埋め込みベクトルの品質に大きく依存します。
RAGシステムは「一度作ったら終わり」ではなく、継続的に改善するための仕組みが重要です。
3 風吹けば名無し 2025-11-04 10:31:02 ID:Abcde123
RAGってなんや?RPGの親戚か?
5 風吹けば名無し 2025-11-04 10:31:48 ID:FgHijk45
タイトルで草
要はゴミ屋敷からは有能なAIは生まれんてことか
8 風吹けば名無し 2025-11-04 10:33:11 ID:IkumenAI
>>3
検索機能がめっちゃ賢くなったチャットボットみたいなもんや
>>5
まさにそれや…うちの社内ドキュメント、重複と古い情報だらけの魔境やからAIもパニック起こしとる。ワイみたいやな。
12 風吹けば名無し 2025-11-04 10:35:09 ID:Lmnop678
イクメンでAI開発とかハイスペック杉内
嫁さん幸せやろなあ
15 風吹けば名無し 2025-11-04 10:36:25 ID:QrStu901
わかる
ワイぼっちプログラマー、休日はひたすらデータクレンジングしてるで
虚無感がすごい
19 風吹けば名無し 2025-11-04 10:38:40 ID:IkumenAI
>>12
嫁と子供が寝静まった深夜だけがワイの時間や…
たまにプレッシャーでパニック障害の気が出てきて手が震えるのが辛いンゴ…
24 風吹けば名無し 2025-11-04 10:40:17 ID:Vwxyz234
Embeddingモデルは何使っとるん?
記事にもあるけど Gemini embedding-001 とか text-embedding-3-large あたりが鉄板ちゃうか?
28 風吹けば名無し 2025-11-04 10:42:51 ID:BcDef567
「1トピック1ファイルの原則」
耳が痛いンゴ…ワイのデスクトップもファイルまみれや…
35 風吹けば名無し 2025-11-04 10:45:03 ID:GhIjk890
ハイブリッド検索とかいうのもあるんか
キーワード検索とベクトル検索の合わせ技とか、もうわけわからん
41 風吹けば名無し 2025-11-04 10:48:22 ID:IkumenAI
>>24
詳しいニキおるやん!text-embedding-3-small使っとる
この記事通りチャンク設計から見直してみるわ。500トークンくらいがええんかな
48 風吹けば名無し 2025-11-04 10:51:36 ID:MnOpq123
結局、AIだろうが人間だろうが、元になる情報がクソやったらアウトってことやな
至極当然の話やった
55 風吹けば名無し 2025-11-04 10:53:19 ID:RsTuv456
ワイ、この記事読んで自分の人生を整理整頓する必要があると感じた(ぼっち)
62 風吹けば名無し 2025-11-04 10:55:58 ID:IkumenAI
みんなサンガツ!光明が見えてきたで!
AI開発ってキラキラしとるように見えて、実態は泥臭いデータ掃除なんやなって…
とりあえず子供のミルク作ってくるわ!
育児の合間に社内AIを開発するイッチ。しかし、AIの精度が上がらず悩んでいたところ、RAG精度向上の鍵が『ナレッジの整理整頓』にあるという記事を発見。スレではAI開発の地道な現実に多くの共感が集まった。
最新技術も基礎が大事ということやな。AI開発の裏にある泥臭い努力に、ワイらも襟を正される思いやで。イッチのAIが無事賢くなることを祈るで!
参考URL:
[1] https://zenn.dev/difymaster/articles/defa930eacd2fe


