Häälsisestus, mis ei lahku kunagi sinu arvutist

Kirjutad midagi privaatset. Päevikusissekannet. Kliendimärkmeid. Tundlikku mustandit, mida keegi teine ei peaks nägema. Tahad seda dikteerida — rääkimine on kiirem kui tippimine — aga iga dikteerimistööriist, mida tead, saadab sinu heli kusagile serverisse.

Sinu toores hääl, iga sõna, iga paus, läbimas kellegi teise infrastruktuuri.

See pole kunagi meile sobinud. Nii et parandasime selle.

Privaatsusprobleem, millest keegi ei räägi

Siin on midagi, mida enamik inimesi ei mõista: kui kasutad pilvepõhist dikteerimist, muutub sinu heli andmeteks kellegi teise serveris. Ja need andmed on haavatavad.

2019. aasta intsident jättis kümneid tuhandeid patsientide dikteeringuid avalikult ligipääsetavaks avatud Amazon S3 bucket'is — koos haiguslugude ja biomeetriliste häälsõrmejälgedega. IBM-i 2026. aasta andmelekke raporti kohaselt on keskmine lekke maksumus ülemaailmselt $4,44 miljonit.

GDPR-i kohaselt klassifitseeritakse inimeste kõne helisalvestised isikuandmeteks ja tundlikeks andmeteks. Ometi enamik kõnetuvastussüsteeme vaikimisi salvestab pilve mudeli treenimiseks, mis tähendab, et sinu toores heli jõuab hoidlatesse, mida ründajad aktiivselt sihivad.

Hääletuvastuse turu maht peaks 2026. aastaks jõudma 7 miljardi dollarini — ja ligikaudu 42% uutest juurutustest töötleb häält nüüd lokaalselt, mitte pilves. Tööstus ärkab privaatsusprobleemi suhtes. Meie otsustasime mitte oodata.

RiteMark v1.0.3: täielikult lokaalne kõnetuvastus

RiteMark sisaldab nüüd häälsisestust, mida juhib whisper.cpp — OpenAI Whisper mudeli C/C++ port, kompileeritud Apple Siliconile natiivselt. Sinu hääl transkribeeritakse otse sinu Macis. Pole pilveteenuseid. Pole API-kutseid. Pole andmeid, mis lahkuksid sinu arvutist.

Kliki tööriistariba mikrofoni nuppu. Hakka rääkima. Sinu sõnad ilmuvad reaalajas.

See ongi kõik. Pole seadistusviisardeid, pole konto loomist, pole API-võtmeid, mida hallata.

Sinu hääl jääb sinu arvutisse — töödeldakse lokaalselt whisper.cpp poolt Apple Siliconis.

💡 Kuidas see kapoti all töötab: Esimesel häälsisestuse kasutamisel laadib RiteMark alla keelemudeli (~1,5GB). Pärast seda töötab kõik võrguühenduseta. Sinu heli jääb mällu, töödeldakse lokaalselt ja tekst läheb otse sinu dokumenti.

Lokaalne täpsus, mis konkureerib pilvega

Võid mõelda: kas lokaalne töötlus ohverdab täpsust? Andmed ütlevad ei.

Vastavalt võrdlustestidele, mis võrdlevad lokaalset Whisperit pilve API-dega, on täpsuse erinevus alla 0,5%. Mõnes testis toimis lokaalne Whisper large-v3 mudel kõige paremini kõigi testitud mudelite seas. Whisper arhitektuuri on valideerinud MLCommons, näidates parimat täpsust kandidaatide seas ja vähendades sõnavigade määra üle 72% võrreldes varasemate võrdlusnäitajatega.

Kompromiss pole täpsus — lihtsalt vajad ühekordset mudeli allalaadimist. Pärast seda saad pilve kvaliteediga transkriptsiooni ilma igasuguse privaatsuskompromissita.

Eesti keel esikohal, 50+ keelt

RiteMark sai alguse eesti kirjutamistööriistana, nii et eesti keele tugi oli prioriteet. Whisper mudel saab eesti keelega märkimisväärselt hästi hakkama mudeli jaoks, mis töötab täielikult lokaalselt ilma internetita.

Lisaks eesti keelele toetab sama mudel üle 50 keele. Vaheta nende vahel vastavalt vajadusele — mudel saab mitme keelega hakkama ilma lisafaile alla laadimata.

Reaalajas voogedastus

Siin on detail, mis teeb suure vahe: tekst ilmub rääkimise ajal, mitte pärast lõpetamist.

Paljud dikteerimistööriistad ootavad, kuni lõpetad lause või teed pausi, siis viskavad tekstiploki korraga välja. RiteMark voogedastab transkriptsiooni reaalajas, nii et näed sõnu ilmumas nende ütlemise ajal. See tundub loomulik — rohkem nagu tippimine kui partii töötlemine.

Miks see on oluline

Lokaalne töötlemine muudab võrrandi täielikult:

Töötab võrguühenduseta. Pole internetti? Pole probleemi. Dikteeri lennukis, suvilas, kõikjal ilma ühenduseta.

Heli ei lahku sinu arvutist. Sinu häälsalvestis töödeldakse mälus ega kirjutata kunagi kettale ega edastata kuhugi.

Pole vaja kontot. Pole registreerimist, pole sisselogimist, pole häältöötluse kasutustingimusi.

Pole kasutuspiiranguid. Dikteeri nii palju kui tahad. Pole API-kvooti, pole minutipõhist arveldust, pole tellimuse taset, mille pärast muretseda.

See on privaatsus disaini järgi, mitte privaatsus lubaduse järgi.

Samuti selles versioonis

Kopeeri Markdownina

Uus valik Ekspordi menüüs: kopeeri oma dokument (või ainult valik) puhta markdown tekstina. Vali esmalt tekst ja see kopeerib ainult valiku. Kui midagi pole valitud, kopeerib terve dokumendi.

Kasulik kleepimiseks GitHubi, e-kirjadesse või mis tahes tööriista, mis mõistab markdown vormindust.

Omaduste dialoogi parandus

Paljude frontmatter omadustega (15+) dokumendid ei ületa enam Omaduste dialoogi piire. Sisu kerib nüüd korralikult oma piirides.

Alustamine

Lae alla RiteMark v1.0.3 väljalaskete lehelt
Ava Seaded ja luba häälsisestus (see on eksperimentaalne, seega praegu opt-in)
Kliki mikrofoni nuppu mis tahes markdown dokumendis
Esimesel kasutamisel laadib Whisper mudel alla (~244MB)
Hakka rääkima

Funktsioon on praegu märgitud eksperimentaalseks. Tahame sinu tagasisidet enne vaikimisi seadeks tegemist. Kui midagi ei tööta ootuspäraselt, anna meile teada.

Mis on tulemas

Häälsisestus on vundament rohkematele lokaalsetele AI funktsioonidele RiteMarkis. Sama filosoofia — võimas, privaatne, pilve pole vaja — juhib kõike, mida järgmisena ehitame.

Sinu sõnad peaksid jääma sinule. Nüüd jääb ka sinu hääl.

Lae alla RiteMark v1.0.3 — see on tasuta.

KKK

Kas häälsisestus vajab internetti? Ainult ühekordse mudeli allalaadimise jaoks. Pärast seda töötab kõik lokaalselt — saad dikteerida täiesti võrguühenduseta.

Kas minu häälsalvestis saadetakse kuhugi? Ei. Kogu kõnetöötlus toimub sinu arvutis kaasasoleva Whisper mudeli abil. Heli ei lahku kunagi sinu arvutist.

Milliseid keeli toetatakse? 50+ keelt, sealhulgas eesti, inglise, saksa, prantsuse, hispaania, vene ja palju muud. Eesti keel on esmaklassiline toetatud keel.

Kui palju kettaruumi kõnemudel vajab? Umbes 1,5GB kaustas ~/.ritemark/models/. Saad selle igal ajal Seadetest eemaldada.

Kas saan kasutada dikteerimist ja tippimist samaaegselt? Jah. Dikteeritud tekst lisatakse kursori asukohta. Saad vabalt tippimise ja dikteerimise vahel vahetada.

Kui täpne on lokaalne dikteerimine võrreldes pilveteenustega? Võrdlustestid näitavad alla 0,5% täpsuse erinevust lokaalse Whisperi ja pilve API-de vahel. Saad peaaegu identse kvaliteedi ilma privaatsuskompromissita.

Kas see töötab Intel Macidel? Praegu on häälsisestus optimeeritud Apple Siliconile (M1/M2/M3/M4). Intel Maci tugi pole praegu saadaval.

Sisukord

Häälsisestus, mis ei lahku kunagi sinu arvutist

Häälsisestus, mis ei lahku kunagi sinu arvutist

Privaatsusprobleem, millest keegi ei räägi

RiteMark v1.0.3: täielikult lokaalne kõnetuvastus

Lokaalne täpsus, mis konkureerib pilvega

Eesti keel esikohal, 50+ keelt

Reaalajas voogedastus

Miks see on oluline

Samuti selles versioonis

Kopeeri Markdownina

Omaduste dialoogi parandus

Alustamine

Mis on tulemas

KKK