Show HN: I trained a 9M speech model to fix my Mandarin tones
저자는 자신의 만다린 발음 문제를 해결하기 위해 900만 개의 음성 모델을 개발했습니다. 이 모델은 약 300시간의 데이터를 기반으로 훈련되었으며, 브라우저에서 실행 가능합니다.
출처: Hacker News — https://simedw.com/2026/01/31/ear-pronunication-via-ctc/
- 모델: 9M Conformer-CTC
- 데이터: ~300시간 (AISHELL + Primewords)
- 양자화: INT8 (11MB)
- 실행: ONNX Runtime Web에서 100% 브라우저 내 실행
- 기능: 음절 발음 및 톤 평가 (Viterbi 강제 정렬 사용)
- 사용해보기: 여기
- 댓글 링크: Hacker News 댓글
의견
댓글/토론에서 나온 의견을 참고용으로 정리했습니다. (사실로 단정하지 말고 맥락 확인 권장)
- Hacker News · @vunderba: When I was living in Taiwan, one of the ways I forced myself to remember to pronounce the tones distinctly was by waving my hand in front of me, tracing the arc of each character’s tone. It helped a lot even if I did look like an insane expat conducting an invisible orchestra. One more thing: there's quite a bit …
- Hacker News · @rahimnathwani: This is incredible. When I was first learning Chinese (casually, ~20 years ago), my teacher used some Windows software that drew a diagram of the shape of my pronunciation, so she could illustrate what I was getting wrong in some objective way. The thing you've built is so good, and I would have loved to have it …
- Hacker News · @jellojello: This is amazing, if you feel like opening an entire language to being learned more easily.. Farsi is a VERY overlooked language, my wife/her family speak it but it's so difficult finding great language lessons (it's also called Persian/Dari)
- Hacker News · @simedw: Thank you. I had a quick look at Farsi datasets, and there seem to be a few options. That said, written Farsi doesn’t include short vowels… so can you derive pronunciation from the text using rules?
- Hacker News · @simedw: For accents, I’ve mostly tested with a few friends so far. I’m wondering whether region should be a parameter, because training on all dialects might make the system too lax.
같이 읽으면 좋은 글
같은 주제이거나 태그가 겹치는 글을 연결해 탐색 흐름을 강화했습니다.
Anthropic Is Having a Month: AI의 현재와 미래
Anthropic의 최근 동향을 통해 AI의 현재와 미래를 탐구하고, 실무에서 적용할 수 있는 방법론과 주의사항을 살펴본다. AI 기술의 발전과 함께 오는 기회와 도전 과제를 심층적으로 분석하며, 안전성과 윤리를 고려한 AI 개발의 중요성을 강조한다.
프로그래머의 멸종 위기: 기술 변화에 대응하는 방법
프로그래머들이 직면한 멸종 위기에 대한 심층 분석과 실무에서의 대응 방안을 제시합니다. 최신 기술 트렌드, 적용 시나리오, 흔한 함정과 주의사항, 체크리스트 등을 포함하여, 개발자들이 변화하는 환경에서 생존할 수 있도록 돕습니다.
Anthropic의 국방부와의 논의에 대한 Dario Amodei의 성명
Anthropic은 AI를 활용해 미국과 민주주의를 방어하고, 독재적 적대국에 대항하는 데 중점을 두고 있다. 그러나 대규모 국내 감시와 완전 자율 무기의 사용은 민주적 가치를 훼손할 수 있다고 보고, 이에 대한 제한을 유지하고자 한다.
이전 글
What the Success of Coding Agents Teaches Us about AI Systems in General
다음 글
Swift is a more convenient Rust
댓글
불러오는 중…