LLM

IT

llama.cpp と Ollama の違いとは?

🐪 llama.cpp と 🦙 Ollama の違いとは? llama.cpp と Ollama はどちらも、大規模言語モデル(LLM)をローカル環境で実行するためのツールですが、それぞれ目的や特徴が異なります。 🐪 llama.cpp と...
IT

llama.cpp Mac M1でQwen3を試す

2025年4月29日にリリースされたQwen3をMac M1で試してみました。こちらはAlibaba(アリババ)社が開発した大規模言語モデル(LLM)の最新版です。「Qwen」は「通義千問(Qianwen)」の略で、「多くの問いに通じる」こ...
IT

モデル圧縮手法の比較:量子化・蒸留・プルーニング

モデル圧縮手法の比較:量子化・蒸留・プルーニング 項目 量子化(Quantization) 知識蒸留(Distillation) プルーニング(Pruning) 目的 モデルサイズを小さくし、推論速度を向上させる 大きなモデルの知識を小さな...
IT

Attention is All You Need とは?

「Attention is All You Need」をわかりやすく解説 ✨ Attention is All You Need とは? 「Attention is All You Need」は2017年に発表された論文で、コンピューターが...
IT

LM StudioをMac M1で使ってみよう

ここでは、Mac M1チップを搭載した端末でLM Studioを使ってローカル環境で大規模言語モデル(LLM)を動かす手順を解説します。 LM Studioとは? LM Studioは、ローカル環境で様々なオープンソースLLM(例:Llam...
IT

AIにおける量子化(Quantization)

AIにおける量子化(Quantization)とは? (子ども向け解説) 量子化(Quantization)は、AIの頭脳(モデル)を小さく・軽く・速くするためのテクニックです。 💡 簡単に言うと? 量子化(Quantization)とは、...
IT

NDCGとは?サンプルを使ってみてみよう。

NDCG(正規化割引累積利得) は、検索エンジンやレコメンダーシステムにおいて、アイテムのランキングの「良さ」を評価する指標です。 特に、「重要な(関連性の高い)アイテムが上位に来ているかどうか」を数値で評価します。 計算方法はこちらになり...