Đề tài: “Thiết kế phần mềm tổng hợp giọng nói và trả về kết quả ở dạng văn bản” 1. Phân tích yêu cầu. Nói chung, với những ai từng nhận những file ghi âm của bạn bè, người thân, đồng nghiệp và đôi khi để nghe được những nội dung cần thiết, người ta phải mất vài phút để tiếp nhận cả những thông tin rườm rà (ví dụ file ghi âm trong một buổi hội thảo về phương pháp làm giàu). Chính vì thế, người ta đã nghĩ tới giải pháp khắc phục tình trạng này cho những người bận rộn, chấm dứt cảnh phải nghe những file ghi âm quá dài một cách không cần thiết. Vì vậy, các phần mềm mới như là: chuyển từ âm thanh sang văn bản đang là một phần của xu hướng dịch vụ đang rất phát triển dựa trên nền tảng công nghệ nhận dạng giọng nói. Rõ ràng, các cuộc hội thảo hiện nay diễn ra thường xuyên mới nên việc sử dụng tính năng nhận dạng giọng nói theo hướng khác nhằm giải quyết vấn đề rất thực tiễn với những người phải tiếp nhận hàng phải đi dự hội thảo mỗi ngày. Thay vì việc phải mất tới vài tiếng đồng hồ để nghe lại nội dung trong một ngày của cuộc hội thảo, những nội dung đó thành rồi gõ lại thành văn bản để báo cáo sếp, bạn có thể sử dụng phần mềm “Chuyển giọng nói thành văn bản”, nhả bạn chỉ đơn giản là ghi âm nội dung cuộc hội thảo rồi về nhà dùng phần mềm chuyển nội dung đó thành văn bản và in ra. Không những thế, phần mềm này ra đời còn giúp ích rất nhiều cho những người khiếm thị, phần mềm giúp họ trao đổi thông tin và làm việc một cách hiệu quả, ví dụ như họ muốn viết văn hoặc làm thơ. Nội dung bài văn hay bài thơ của họ sẽ được chuyển thành văn bản ngay khi họ đọc ra những suy nghĩ của mình. Hay như trong trường hợp có người đọc cho bạn số điện thoại hay nói với bạn về địa chỉ hẹn gặp, không phải lúc nào bạn cũng có sẵn giấy bút bên người để ghi. Với những bức thông điệp kiểu này, bạn có thể lưu cuộc thoại lại và dùng phần mềm chuyển những thông tin đó thành văn bản bất cứ khi nào bạn cần. Chất lượng vẫn cần được thẩm định Hiện nay, đúng đang có một làn sóng mới xuất hiện của loại hình dịch vụ sử dụng công nghệ nhận dạng giọng nói, song cả công nghệ lẫn các dịch vụ sử dụng công nghệ này còn đang ở giai đoạn manh nha và độ chính xác của những thông điệp được “phiên dịch” đó còn cần phải xem xét. “Công nghệ nhận dạng giọng nói cũng như chuyển dịch dạng thức thông điệp đã có chất lượng tạm chấp nhận. Song nếu môi trường xung quanh quá ồn, chất lượng công nghệ chắc chắc sẽ giảm”.
Thêm một vấn đề nữa là số lượng ngôn ngữ mà phần mềm có thể nhận dạng và chuyển thành văn bản là bao nhiêu? Việc này đòi hỏi một cơ sở dữ liệu khá lớn để thực hiện và đáp ứng yêu cầu, lựa chọn của người sử dụng.
2.
Nội dung chương trình và giao diện:
Chương trì nh có khả năng nhậ n dạ ng giọ ng nói từ file *.mp3 hoặc *.WAV rồ i chuyể n thà nh file text .
Phần mềm được thực hiện qua 2 giai đoạn: tạo file âm thanh, chuyển file âm thanh sang văn bản. File âm thanh có thể là file bạn tạo trực tiếp từ phần mềm hoặc là một file có sẵn như file ghi âm. Để tạo ra một file âm thanh mới, bạn vào File chọn New. Khi đó giao diện màn hình như trên sẽ xuất hiện. *Nút Speak: để bạn bắt đầu thực hiện thu âm, ghi giọng nói. *Nút Pause: tạm thời dừng ghi âm và bạn có thể tiếp tục thực hiện công việc. *Nút Stop: dừng hẳn việc ghi âm lại nữa. *Nút Delete: Xóa file bạn vừa ghi. * Nút Read Record: chuyển nội dung âm thanh thành văn bản ở màn hình bên phải. Bạn có thể lưu file âm thanh khi đã ghi xong bằng cách click vào nút Save hoặc vào File chọn Save, ngoài ra khi bạn thoát khỏi chương trình bao giờ phần mềm cũng xuất hiện hộp thoại hỏi bạn có muốn lưu không, bạn lựa chọn các chức năng trên hộp thoại tùy theo mục đích của mình.
Một điều lưu ý là khi tiến hành ghi âm trực tiếp bạn nên dùng tai nghe (micro phone) để
nói, vi nếu bạn nói quá nhỏ, hệ thống vẫn thực hiện thu nhưng không rõ là bạn nói gì thì sẽ đưa ra hộp thoại báo lỗi như trên.