Deepgram Anmeldelse
Deepgram er en stemme-AI-API-plattform med bransjeledenende tale-til-tekst, tekst-til-tale og sanntids stemmeagent-API-er med under 300 ms ventetid, brukt av 200 000+ utviklere og IBM som offisiell stemme-AI-partner.
78
Oppdatert for 36d sidenGratisplan
Best for
- Utviklere som bygger stemmeaktiverte applikasjoner, automatisering av kundesenter eller transkripsjonsrørledninger
- AI-team som bygger stemmeagenter som trenger pålitelig STT og TTS i ett API
- Produktteam som legger til sanntidstranskripsjon i videokonferanseverktøy
- Bedrifter som krever HIPAA-kompatibel distribusjon på stedet eller privat sky
Hopp over dette hvis…
- Ikke-tekniske brukere som trenger en forbruker-transkripsjonapp fremfor et API
- Team som bygger talearbeidsflyter der et alt-i-ett-verktøy som Otter.ai er tilstrekkelig
- Prosjekter som krever tale-til-tekst på 50+ språk der Google eller Azure kan ha bedre dekning
What is Deepgram?
Deepgram is an API platform for voice AI. It offers three core products: speech-to-text that converts audio to text with industry-leading accuracy, text-to-speech that generates natural-sounding voices from text, and a Voice Agent API that combines STT, TTS, and LLM inference into a single endpoint for building conversational voice agents.
Founded in 2015 and headquartered in San Francisco, Deepgram built its own end-to-end deep learning models rather than relying on traditional speech recognition pipelines. The result is significantly lower latency and better accuracy than legacy providers, particularly on noisy audio and accented speech. In February 2026, IBM named Deepgram as its first voice AI partner, integrating Deepgram's APIs into IBM's enterprise AI stack.
Nova-3 and accuracy benchmarks
Deepgram's Nova-3 model consistently ranks first or second in word error rate benchmarks across English audio types. On typical business audio (meetings, phone calls, podcasts), Nova-3 outperforms Google Speech-to-Text v2, AWS Transcribe, and OpenAI Whisper on both accuracy and latency.
The latency story is what separates Deepgram for real-time applications. Sub-300ms round-trip latency makes it viable for live conversation, whereas many competing services introduce delays that make voice agents feel unresponsive. For synchronous voice agent use cases, this is the most important technical differentiator.
Pricing and the Voice Agent API
The free tier provides $200 in API credits, which translates to roughly 46 hours of Nova-3 transcription or 45 minutes of Voice Agent API usage. Pay-as-you-go rates start at $0.0043 per minute for Nova-3 speech-to-text and $0.015 per 1000 characters for text-to-speech.
The Voice Agent API is priced at $4.50 per hour and bundles STT, TTS, and LLM inference together. For teams building voice agents, this simplifies pricing to a single per-conversation cost rather than managing three separate API bills. Volume discounts are negotiable for enterprise workloads above a certain monthly spend.
Fellesskap og veiledninger
Hva utviklere og skapere sier om Deepgram.
Building a Real-Time Voice Agent with Deepgram in 15 Minutes
Deepgram DevRel · tutorial
Priser
- Gratis nivå inkluderer $200 i API-kreditter (ca. 46+ timer lyd)$200
- Betal-etter-bruk fra $0,0043/min for Nova-3 STT$0,0043/min
- Stemmeagent-API til $4,50/time inkluderer LLM-kostnader$4,50/time
Free And PaidGratisplan tilgjengelig
Fordeler
- Bransjeledenende ordfeiltakt med Nova-3-modellen, overgår Google og AWS
- Under 300 ms ende-til-ende ventetid gjør det egnet for sanntidssamtaleapplikasjoner
- Stemmeagent-API samler STT, TTS og LLM-kostnader til $4,50/time
- 200 000+ utviklere og $200 gratis kreditter senker terskelen for å komme i gang
- IBM-partnerskap (februar 2026) bekrefter enterprise-grade pålitelighet
Ulemper
- Kun API-produkt, ingen forbrukervendt app for enkel filtranskripsjon
- Språkstøtte er smalere enn Google Speech-to-Text eller Azure
- Betal-etter-bruk kan bli uforutsigbart for applikasjoner med varierende trafikk
Plattformer
webapi
Sist verifisert: 2. april 2026
Vi kan få provisjon uten ekstra kostnad for deg. Les mer