
Database vektor biji pinus sekarang dapat menangani pencarian kata kunci-semantik hibrid

Ketika Pinecone mengumumkan database vektor pada awal tahun lalu, ia sedang membangun sesuatu yang dirancang khusus untuk pembelajaran mesin dan ditujukan untuk ilmuwan data. Idenya adalah Anda dapat mengkueri data ini dalam format yang dimengerti mesin, membuatnya jauh lebih cepat.
Awalnya ini melibatkan pencarian semantik di mana pengguna dapat mencari berdasarkan makna, bukan kata-kata tertentu. Namun ternyata, ketika orang menggunakan Pinecone, ada kasus penggunaan di mana kata kunci tertentu penting, dan hari ini perusahaan mengumumkan bahwa sekarang mungkin untuk melakukan pencarian yang menggabungkan pencarian semantik dan kata kunci, apa yang disebut oleh pendiri dan CEO perusahaan Edo Liberty pencarian hibrid.
“Kami telah melakukan banyak penelitian tentang topik ini dan kami menemukan bahwa, pada kenyataannya, pencarian hibrid menjadi lebih baik [in many cases]. Lebih baik dalam arti bahwa jika Anda dapat menggabungkan kedua pencarian semantik, ini adalah pengkodean kalimat NLP yang dalam yang mendapatkan konteks dan makna dan sebagainya, tetapi Anda juga dapat memasukkannya dengan kata kunci tertentu… kombinasi keduanya berakhir menjadi jauh lebih baik, “kata Liberty kepada TechCrunch.
Faktanya, dia mengatakan keduanya saling melengkapi dengan baik, terutama dalam kasus di mana istilah khusus industri penting. Ini bisa seperti dokter yang mencari kata kunci yang terkait dengan penyakit tertentu. Dalam kasus tersebut, konteks medis dapat memberikan hasil yang lebih baik dengan menggabungkan pertanyaan dan beberapa kata kunci spesifik seputar penyakit tertentu.
Dia mengatakan bahwa kata kunci tidak pernah lebih diutamakan daripada pertanyaan semantik yang diajukan pengguna, tetapi mereka memberikan beberapa informasi tambahan untuk membantu mengembalikan hasil yang lebih bermakna.
“Anda mungkin tahu persis apa yang Anda cari, dan Anda mungkin dapat memberikan keuletan ekstra saat Anda membuat kata kunci pencarian semantik Anda sadar — dan itu benar-benar sangat membantu. Jadi saya tidak ingin membuang bagian bagus dari pencarian kata kunci [by relying completely on semantic search]. Saya tidak ingin kata kunci berada di kursi pengemudi, tetapi saya juga tidak mengabaikannya sepenuhnya, ”katanya.
Seperti yang dikatakan Liberty kepada kami pada saat Seri A perusahaan senilai $28 juta tahun lalu, penelusuran telah menjadi kasus penggunaan yang besar bagi perusahaan.
“Penggunaan utama dari database vektor adalah untuk pencarian, dan pencarian dalam arti kata yang luas. Ini mencari melalui dokumen, tetapi Anda dapat menganggap pencarian sebagai pencarian informasi secara umum, penemuan, rekomendasi, deteksi anomali dan sebagainya, ”katanya saat itu.
Pinecone diluncurkan pada 2019 dan telah mengumpulkan $38 juta, per Crunchbase.