
Musixmatch meluncurkan platform podcast untuk transkripsi yang digerakkan oleh AI dan komunitas
Perusahaan Musixmatch yang berbasis di Italia terkenal karena menyediakan lirik yang didukung komunitas untuk platform streaming musik utama termasuk Spotify, Apple Music, YouTube Music, Amazon Music, dan Tidal. Sekarang meluncurkan platform baru untuk podcast yang menggabungkan transkripsi yang dihasilkan AI dan pengeditan yang diverifikasi komunitas.
Meskipun ada jutaan acara dan episode podcast yang tersedia untuk pendengar, Musixmatch berpendapat bahwa pencarian podcast rusak. Akibatnya, banyak podcast bagus yang tidak terhubung dengan calon penggemar. Jadi itu menggunakan pengalamannya dalam melatih model AI melalui lirik dan memanfaatkan keahlian NLP (pemrosesan bahasa alami) untuk meningkatkan transkripsi, pencarian, penemuan, dan berbagi podcast.
Platform podcast Musixmatch secara otomatis menghasilkan transkripsi setiap hari untuk beberapa episode podcast teratas di berbagai topik dan bagan. Ini menggunakan arsitektur model dasar NLP, Umberto, untuk menandai kata kunci seperti tempat, orang, dan topik dengan ID Wikipedia — ID alfanumerik yang ditautkan ke topik di Wikipedia. (Misalnya, tautan ini menunjukkan ID Wikipedia yang terkait dengan TechCrunch.)
Karena pendekatan ini, dikatakan bahwa orang yang menelusuri topik ini dalam bahasa apa pun akan mendapatkan hasil yang akurat.
Startup tersebut menjelaskan kepada TechCrunch bahwa berdasarkan ID ini, ia membuat grafik topik yang disebut TopicRank yang memeringkat podcast berdasarkan faktor-faktor seperti jumlah penyebutan dalam sebuah episode atau keahlian presenter tentang topik — meningkatkan hasil pencarian podcast saat pengguna mencari topik-topik terkait.

Kredit Gambar: Musicmatch
“Berkat klasifikasi ini, orang akhirnya dapat mencari kata kunci tertentu dan menemukan podcast transkrip yang cocok dengan kueri mereka, diurutkan berdasarkan relevansinya. Indeks pencarian kami mengembalikan serangkaian hasil yang jauh lebih detail dan mendalam daripada layanan mendengarkan lainnya yang mengandalkan metadata RSS standar serta genre dan kategori yang telah ditentukan sebelumnya, ”klaim perusahaan.
Saat pengguna mencari di platform podcast Musixmatch, itu menunjukkan cuplikan dari transkripsi tempat frasa yang dicari disebutkan. Jika mereka mengklik hasilnya, podcast akan mulai diputar langsung dari stempel waktu cuplikan yang menyebutkan frasa tersebut. Itu cukup rapi ketika Anda perlu mendengarkan audio beberapa menit sambil meneliti sesuatu.
Musixmatch telah lama mengandalkan komunitasnya untuk mengedit lirik secara akurat, dan sekarang meminta pengguna ini untuk melakukan hal yang sama dengan podcast. Portal podcast baru perusahaan juga menyertakan alat yang disebut Podcast Studio, yang memungkinkan editor dan pemilik podcast memperbaiki transkripsi yang dihasilkan AI — terutama berguna untuk hal-hal seperti orang dan nama merek atau referensi budaya.
Jika tidak ada transkrip untuk episode tertentu, pemilik atau anggota komunitas dapat menggunakan Podcast Studio untuk membuatnya. Musixmatch mengatakan butuh kira-kira lima menit bagi AI untuk menghasilkan transkrip untuk sebuah episode. Pendengar reguler juga dapat memilih episode untuk transkripsi sehingga komunitas memprioritaskannya.

Kredit Gambar: Musicmatch
Penting untuk dicatat bahwa pada platform Musixmatch, transkripsi yang dihasilkan AI akan memiliki tag seperti “Speaker 1” dan “Speaker 2”, sedangkan episode yang diedit Komunitas akan memiliki label dengan nama speaker — bersama dengan label “terverifikasi”.

Transkripsi dan tag podcast yang dikuratori manusia. Kredit Gambar: Musicmatch
Perusahaan juga mempermudah berbagi dengan menampilkan kartu yang memiliki cuplikan teks dari podcast dengan tautan yang dapat dibagikan. Terlebih lagi, ini bekerja pada fitur yang disebut audiogram, yang merupakan video kecil yang dapat dibagikan yang mencakup cuplikan audio dan teks bergulir dari podcast.

Kredit Gambar: Musicmatch
Musixmatch tidak ingin menyimpan semua data ini untuk dirinya sendiri. Ini memungkinkan pemilik podcast untuk mengekspor transkripsi ke umpan web dan aplikasi mereka. Dan karena teks-teks ini SEO-friendly, menurutnya akan memudahkan pendengar untuk mencarinya.
Beberapa mitra Musixmatch katanya menggunakan alatnya untuk transkripsi termasuk “The Talent Show” oleh FT Talent; “Beyond the Ordinary” dan “Why I Run” oleh Red Bull; dan seluruh produksi Chora Media.
Meskipun platform podcast Musixmatch menawarkan fitur untuk pendengar, platform ini tidak hanya mencoba menjadi pemutar podcast. Startup tersebut berpendapat bahwa pesaingnya adalah perusahaan yang bekerja di ruang analitik audio — termasuk aplikasi yang menyediakan layanan transkripsi (seperti Podcastle).
“Menurut kami, analisis audio (AI, semantik, dll.) akan menjadi hal yang harus dimiliki dalam waktu dekat, untuk banyak kasus penggunaan yang berbeda. Kami berada dalam posisi unik untuk menyediakan layanan tersebut untuk podcast karena teknologi analisis konten bertenaga AI kami, komunitas kami yang terlibat, dan peran kami dalam DSP [Digital Streaming Platforms]di mana kami sudah mensindikasikan konten pihak ketiga,” kata chief product officer perusahaan, Marco Paglia, kepada TechCrunch melalui email.
Dia menambahkan bahwa salah satu tujuan perusahaan adalah menjadi penyedia transkripsi terverifikasi untuk layanan lain — seperti penawarannya di ruang lirik.