728x90
반응형
SMALL
AI 프로젝트(한번씩 봐주시면 감사하겠습니다.)
-
[비교/검증-8] #11. Edge Agent AI 음성처리 : 순정모델 vs 커스텀모델(경제/시사 학습) / 순정(Tiny) vs 커스텀(Tiny) 안녕하세요!!!지난 포스팅에서는1. 각 모델별(small, large, turbo, medium) 성능비교2026.05.11-[비교/검증-7] #9. Edge Agent AI 음성처리 : STT+화자분리 최종비교 / 스몰vs 터보, 그리고 '최적화'의 마법 - 4종 벤치마크 총 정리(small,medium,turbo,large) [비교/검증-7] #9. Edge Agent AI 음성처리 : STT+화자분리 최종비교 / 스몰vs 터보, 그리고 '최적화'의 마지난 포스팅에서는 제가 직접 각 모델들을 이제 윈도우 환경에서 구동하고 분석시에 세밀한 조정을 할 수 있도록 GUI로 만들었습니다.이제 도구는 완성되었습니다. 그렇다면 우리는 이 도구를uno-kim.tistory.com2. 그리고 이제 모델별 성능비교를.. -
[개발문서-2] #10. 도메인 특화 STT 모델학습 : CPU 노트북으로 도전하는 Whisper Tiny 파인튜닝 (Whisper.cpp 기반 STT 모델 학습 프로그래밍) 화자분리를 가장 널리 알려진 Whisper.cpp와 vosk 를 이용해서 간단하게 GUI 프로그램을 만들어 비교를 하면서 느낀것이그저 모델만 좋은 것보다. 한번 파인튜닝으로 깎아서 진행한다면 어떨까? 라는 의문이 들었고 궁금해졌습니다.그래서 우선 가볍에 프로토타입 형식으로 한글을 거의 알아듣지 못하는 Tiny 모델을 한국어 경제방송을 학습시키면 한국어를 알아들을까?라는 가설 그리고 ...만약 1번의 가설이 참이면, 스몰~라지 등 모델들을 학습시키게 된다면 그럼 성능은 어디까지 올라갈까?그래서 지금 포스팅부터 도메인 특화 모델을 한번 만들어서 이 한계가 어디까지인지 또 비교 분석해보겠습니다.!!!!소스코드https://github.com/uno-km/AMEVA-STT-Trainer GitHub - uno-.. -
[비교/검증-7] #9. Edge Agent AI 음성처리 : STT+화자분리 최종비교 / 스몰vs 터보, 그리고 '최적화'의 마법 - 4종 벤치마크 총 정리(small,medium,turbo,large) 지난 포스팅에서는 제가 직접 각 모델들을 이제 윈도우 환경에서 구동하고 분석시에 세밀한 조정을 할 수 있도록 GUI로 만들었습니다.이제 도구는 완성되었습니다. 그렇다면 우리는 이 도구를 어떻게 '가장 잘' 쓸 수 있을까요?2026.05.10-[개발문서-1] #9. Edge Agent AI 음성처리 : 대규모 배치 자동화 및 태스크 기반 데이터 관리 아키텍처 구현 - 테스트자동화 Tool 구현 [개발문서-1] #9. Edge Agent AI 음성처리 : 대규모 배치 자동화 및 태스크 기반 데이터 관리 아키텍처1. 개요본 포스팅에서는 지난 포스팅에서 구축한 Vosk + Whisper.cpp 하이브리드 파이프라인을 실무 환경에 적용하기 위한 운영 고도화 과정을 다룹니다.[비교/검증-6] #8. Edge Age.. -
[개발문서-1] #9. Edge Agent AI 음성처리 : 대규모 배치 자동화 및 태스크 기반 데이터 관리 아키텍처 구현 - 테스트자동화 Tool 구현 1. 개요본 포스팅에서는 지난 포스팅에서 구축한 Vosk + Whisper.cpp 하이브리드 파이프라인을 실무 환경에 적용하기 위한 운영 고도화 과정을 다룹니다.[비교/검증-6] #8. Edge Agent AI 음성처리 : Vosk + Whisper.cpp 하이브리드 파이프라인 구축 및 X-Vector 기반 화자 식별 알고리즘 검증 [비교/검증-6] #8. Edge Agent AI 음성처리 : Vosk + Whisper.cpp 하이브리드 파이프라인 구축 및 X-Vector 기반제 포스팅은 AI가 작성한게 아닌 한글자 한글자 타자를 쳐서 작성한 포스팅입니다. 구독 좋아요 댓글은 힘이됩니다. 안녕하세요~~~!!! 지난 포스팅에서는 조금 알려진 STT +화자분리 되는 무료 엔uno-kim.tistory.com.. -
[비교/검증-6] #8. Edge Agent AI 음성처리 : Vosk + Whisper.cpp 하이브리드 파이프라인 구축 및 X-Vector 기반 화자 식별 알고리즘 검증 제 포스팅은 AI가 작성한게 아닌 한글자 한글자 타자를 쳐서 작성한 포스팅입니다. 구독 좋아요 댓글은 힘이됩니다. 안녕하세요~~~!!! 지난 포스팅에서는 조금 알려진 STT +화자분리 되는 무료 엔진, 모델을 한번 모바일/ARM/Termux 환경에서 구동해보고 직접 비교해봤습니다. 정말 냉장고나 어디 모뎀에 쓰일것같은 후진 CPU가 어디까지 커버할수있나 고생이 많군요..그런데 그 과정중 한번 직접 화자분리를 할수있지않을까...? 하는 생각이 떠올라서 포스팅을 작성하게 되었습니다.하이브리드 아키텍처 도입 배경 이전 연구에서 확인하였듯, Vosk 엔진은 모바일 환경에서 화자의 음향적 특징을 추출하는 데는 우수하나, 언어 모델의 한계로 인해 텍스트 변환 정확도가 크게 떨어집니다.반면 Whisper 모델은 텍스..
edge AI 연구/분석/검증
edge AI - 음성인식 연구/분석/검증
- [비교/검증-8] #11. Edge Agent AI 음성처리 : 순정모델 vs 커스텀모델(경제/시사 학습) / 순정(Tiny) vs 커스텀(Tiny) more
- [개발문서-2] #10. 도메인 특화 STT 모델학습 : CPU 노트북으로 도전하는 Whisper Tiny 파인튜닝 (Whisper.cpp 기반 STT 모델 학습 프로그래밍) more
- [비교/검증-7] #9. Edge Agent AI 음성처리 : STT+화자분리 최종비교 / 스몰vs 터보, 그리고 '최적화'의 마법 - 4종 벤치마크 총 정리(small,medium,turbo,large) more
- [개발문서-1] #9. Edge Agent AI 음성처리 : 대규모 배치 자동화 및 태스크 기반 데이터 관리 아키텍처 구현 - 테스트자동화 Tool 구현 more
내가 만든파일~
- [LLM학습샘플파일-1]the-verdict.txt more
- [KT]Vivace-PLM마스코트 사진 more
- [KT]Vivace-PLM시스템 마스코트 more
- [Remix IDE] 리믹스 IDE를 윈도우에도 실행 / Remix-IDE Window version more
- 이클립스에서 JavaScipt 자동완성 / 이클립스 tern 설치 more
- 자바 Jar 파일 디컴파일 / Jad / 자바 jad/ 자바 문서 보기/ 자바 라이브러리 소스보기/ 자바 라이브러리/자바 jar 파일 보기 / Class File Editor/ 자바 Source not found해결 more
- 이클립스 Spring Tool Suite 4 설치파일 / STS 4 파일 설치 / 나만의 환경설정셋팅 more
728x90
반응형
LIST