Deepgram Anmeldelse

Deepgram er en stemme-AI-API-plattform med bransjeledenende tale-til-tekst, tekst-til-tale og sanntids stemmeagent-API-er med under 300 ms ventetid, brukt av 200 000+ utviklere og IBM som offisiell stemme-AI-partner.

Oppdatert for 36d sidenGratisplan

Best for

  • Utviklere som bygger stemmeaktiverte applikasjoner, automatisering av kundesenter eller transkripsjonsrørledninger
  • AI-team som bygger stemmeagenter som trenger pålitelig STT og TTS i ett API
  • Produktteam som legger til sanntidstranskripsjon i videokonferanseverktøy
  • Bedrifter som krever HIPAA-kompatibel distribusjon på stedet eller privat sky

Hopp over dette hvis…

  • Ikke-tekniske brukere som trenger en forbruker-transkripsjonapp fremfor et API
  • Team som bygger talearbeidsflyter der et alt-i-ett-verktøy som Otter.ai er tilstrekkelig
  • Prosjekter som krever tale-til-tekst på 50+ språk der Google eller Azure kan ha bedre dekning

What is Deepgram?

Deepgram is an API platform for voice AI. It offers three core products: speech-to-text that converts audio to text with industry-leading accuracy, text-to-speech that generates natural-sounding voices from text, and a Voice Agent API that combines STT, TTS, and LLM inference into a single endpoint for building conversational voice agents. Founded in 2015 and headquartered in San Francisco, Deepgram built its own end-to-end deep learning models rather than relying on traditional speech recognition pipelines. The result is significantly lower latency and better accuracy than legacy providers, particularly on noisy audio and accented speech. In February 2026, IBM named Deepgram as its first voice AI partner, integrating Deepgram's APIs into IBM's enterprise AI stack.

Nova-3 and accuracy benchmarks

Deepgram's Nova-3 model consistently ranks first or second in word error rate benchmarks across English audio types. On typical business audio (meetings, phone calls, podcasts), Nova-3 outperforms Google Speech-to-Text v2, AWS Transcribe, and OpenAI Whisper on both accuracy and latency. The latency story is what separates Deepgram for real-time applications. Sub-300ms round-trip latency makes it viable for live conversation, whereas many competing services introduce delays that make voice agents feel unresponsive. For synchronous voice agent use cases, this is the most important technical differentiator.

Pricing and the Voice Agent API

The free tier provides $200 in API credits, which translates to roughly 46 hours of Nova-3 transcription or 45 minutes of Voice Agent API usage. Pay-as-you-go rates start at $0.0043 per minute for Nova-3 speech-to-text and $0.015 per 1000 characters for text-to-speech. The Voice Agent API is priced at $4.50 per hour and bundles STT, TTS, and LLM inference together. For teams building voice agents, this simplifies pricing to a single per-conversation cost rather than managing three separate API bills. Volume discounts are negotiable for enterprise workloads above a certain monthly spend.

Fellesskap og veiledninger

Hva utviklere og skapere sier om Deepgram.

Building a Real-Time Voice Agent with Deepgram in 15 Minutes

Deepgram DevRel · tutorial

Priser

  • Gratis nivå inkluderer $200 i API-kreditter (ca. 46+ timer lyd)$200
  • Betal-etter-bruk fra $0,0043/min for Nova-3 STT$0,0043/min
  • Stemmeagent-API til $4,50/time inkluderer LLM-kostnader$4,50/time
Free And PaidGratisplan tilgjengelig

Fordeler

  • Bransjeledenende ordfeiltakt med Nova-3-modellen, overgår Google og AWS
  • Under 300 ms ende-til-ende ventetid gjør det egnet for sanntidssamtaleapplikasjoner
  • Stemmeagent-API samler STT, TTS og LLM-kostnader til $4,50/time
  • 200 000+ utviklere og $200 gratis kreditter senker terskelen for å komme i gang
  • IBM-partnerskap (februar 2026) bekrefter enterprise-grade pålitelighet

Ulemper

  • Kun API-produkt, ingen forbrukervendt app for enkel filtranskripsjon
  • Språkstøtte er smalere enn Google Speech-to-Text eller Azure
  • Betal-etter-bruk kan bli uforutsigbart for applikasjoner med varierende trafikk

Plattformer

webapi
Sist verifisert: 2. april 2026

Vi kan få provisjon uten ekstra kostnad for deg. Les mer

FAQ

Hva er Deepgram?
Deepgram er en stemme-AI-API-plattform med bransjeledenende tale-til-tekst, tekst-til-tale og sanntids stemmeagent-API-er med under 300 ms ventetid, brukt av 200 000+ utviklere og IBM som offisiell stemme-AI-partner.
Har Deepgram en gratisplan?
Ja, Deepgram tilbyr en gratisplan. Gratis nivå inkluderer $200 i API-kreditter (ca. 46+ timer lyd). Betal-etter-bruk fra $0,0043/min for Nova-3 STT. Stemmeagent-API til $4,50/time inkluderer LLM-kostnader.
Hvem passer Deepgram best for?
Deepgram passer best for utviklere som bygger stemmeaktiverte applikasjoner, automatisering av kundesenter eller transkripsjonsrørledninger; aI-team som bygger stemmeagenter som trenger pålitelig STT og TTS i ett API; produktteam som legger til sanntidstranskripsjon i videokonferanseverktøy; bedrifter som krever HIPAA-kompatibel distribusjon på stedet eller privat sky.
Hvem bør hoppe over Deepgram?
Deepgram er kanskje ikke ideelt for ikke-tekniske brukere som trenger en forbruker-transkripsjonapp fremfor et API; team som bygger talearbeidsflyter der et alt-i-ett-verktøy som Otter.ai er tilstrekkelig; prosjekter som krever tale-til-tekst på 50+ språk der Google eller Azure kan ha bedre dekning.
Har Deepgram et API?
Ja, Deepgram tilbyr et API for programmatisk tilgang.
Hvilke plattformer støtter Deepgram?
Deepgram er tilgjengelig på web, api.

Get the best AI deals in your inbox

Weekly digest of new tools, exclusive promo codes, and comparison guides.

No spam. Unsubscribe anytime.

Deepgram

Kom i gang