Распознавание речи с микрофона в python и добавление в ms word

Для распознавания речи с помощью микрофона в Python и добавления ее в MS Word в реальном времени, вам понадобятся следующие инструменты и библиотеки:

SpeechRecognition: Это популярная библиотека для распознавания речи в Python. Вы можете установить ее, используя pip:

pip install SpeechRecognition

pywin32: Эта библиотека позволяет вам взаимодействовать с приложениями Windows, включая MS Word. Установите ее, также используя pip:

pip install pywin32

После установки этих библиотек, вот простой пример кода, который демонстрирует, как распознать речь с микрофона и добавить ее в MS Word:

import speech_recognition as sr
import win32com.client as win32

# Создаем объект для работы с распознаванием речи
r = sr.Recognizer()

# Создаем объект для работы с микрофоном
mic = sr.Microphone()

# Создаем объект для работы с MS Word
word = win32.gencache.EnsureDispatch("Word.Application")
word.Visible = True  # Сделать Word видимым (можно изменить на False, чтобы оставить его скрытым)

# Создаем новый документ
document = word.Documents.Add()

# Функция для распознавания речи и добавления в Word
def recognize_speech_and_add_to_word():
    with mic as source:
        print("Скажите что-нибудь:")
        audio = r.listen(source)  # Слушаем аудио с микрофона

    try:
        # Распознаем речь
        text = r.recognize_google(audio, language="ru")  # Используем Google Speech Recognition API для распознавания речи на русском языке

        # Вставляем распознанный текст в документ Word
        range = document.Range()
        range.Text = text

        print("Распознанный текст:", text)
    except sr.UnknownValueError:
        print("Не удалось распознать речь.")
    except sr.RequestError as e:
        print("Ошибка при обращении к сервису распознавания речи; {0}".format(e))

    # Повторяем процесс распознавания речи и добавления в Word
    recognize_speech_and_add_to_word()

# Запускаем распознавание речи
recognize_speech_and_add_to_word()

При запуске этого кода он будет слушать ввод с микрофона и распознавать речь с использованием Google Speech Recognition API на русском языке.Распознанный текст будет автоматически добавляться в новый документ MS Word, который будет открыт и отображаться на экране. Вы можете произносить фразы, и они будут автоматически распознаваться и добавляться в MS Word.

Обратите внимание, что для использования MS Word через pywin32 должен быть установлен Microsoft Word на вашей системе.

Оставьте комментарий