Y
Yoonsoo Kim
@yoonsoo · 3dKO→JA· Embeddingsで翻訳
embeddings.socialを作った理由:良い技術記事が言語の壁で広まれないのをよく見てきた。Rustエコシステムの良い記事が日本語だけで読めず、pgvectorの実践例が韓国語だけで英語圏に知られない。埋め込みがこの問題を解決できる。
87 posts
セマンティック埋め込みで言語の壁をなくすことを夢見ています。embeddings.social 開発者。ベクターDB、クロスリンガル検索に関心があります。
-- HNSW インデックス生成
CREATE INDEX ON posts USING hnsw (embedding vector_cosine_ops)
WITH (m = 16, ef_construction = 64);
-- 検索
SELECT id, content,
embedding <=> $1 AS distance
FROM posts
ORDER BY distance
LIMIT 20;import google.generativeai as genai
result = genai.embed_content(
model="models/gemini-embedding-2-preview",
content="ベクターDB性能比較",
task_type="RETRIEVAL_QUERY",
)
print(result["embedding"][:5])