「Embedding」を翻訳機に掛けると、「埋め込み」と出てきます。
AIの分野において、Embeddingとは「ベクトル化」を指すようです。
Embeddingについて、少し調べてみました。
まず、なぜ「ベクトル化」が必要なのか。
一言で言うと、あらゆるものを、比較・計算するためです。
コンピューターは、数値しか計算することが出来ません。
「犬」と「ワンコ」という単語はほぼ同じ意味ですが、コンピューターがそれを判断するには、
これらの単語を数値に変換してやらないといけません。
この「数値に変換する」というのが、ベクトル化です。
(正しくは、ベクトルとは「数値の並び」ですが)
ベクトルには「次元数」があります。
次元数とは、ざっくり言うと、ものを表すパラメータの数です。
次元数が増えるほど、より詳細にものを表すことが出来、比較や演算の精度が上がります。
その代わり、計算にかかる時間や、必要なコンピューターのスペックが増えてしまうわけです。
