Управление компьютером с помощью голоса в Python

Для управления компьютером с помощью распознавания речи и библиотеки GTTS (Google Text-to-Speech) вам понадобятся дополнительные инструменты и компоненты. Вот примерный алгоритм работы:

  1. Установите необходимые библиотеки. Вам понадобятся SpeechRecognition и gTTS. Установите их с помощью pip:
pip install SpeechRecognition gtts

2. Импортируйте необходимые модули в своем коде:

import speech_recognition as sr
from gtts import gTTS
import os

3. Создайте функцию для распознавания речи и выполнения действий на основе распознанного текста:

def recognize_speech():
    # Создаем объект Recognizer
    r = sr.Recognizer()

    # Запускаем прослушивание с микрофона
    with sr.Microphone() as source:
        print("Скажите команду:")
        audio = r.listen(source)

    try:
        # Используем Google для распознавания речи
        text = r.recognize_google(audio, language="ru")
        print("Вы сказали: " + text)
        
        # Выполняем действия на основе распознанного текста
        if text == "открой браузер":
            # Выполняем команду для открытия браузера
            os.startfile("C:\Path\to\browser.exe")  # Замените на путь к исполняемому файлу вашего браузера
        elif text == "закрой браузер":
            # Выполняем команду для закрытия браузера
            os.system("taskkill /im browser.exe /f")  # Замените на имя процесса вашего браузера
        elif text == "включи музыку":
            # Выполняем команду для включения музыки
            os.startfile("C:\Path\to\music.mp3")  # Замените на путь к вашему музыкальному файлу
        elif text == "выключи музыку":
            # Выполняем команду для выключения музыки
            os.system("taskkill /im mpc-hc.exe /f")  # Замените на имя процесса вашего медиа-плеера
        else:
            # Обрабатываем нераспознанную команду
            print("Нераспознанная команда")
    except sr.UnknownValueError:
        print("Не удалось распознать речь")
    except sr.RequestError as e:
        print("Ошибка сервиса распознавания речи: {0}".format(e))

4. Используйте библиотеку GTTS для преобразования текста в речь и воспроизведения на компьютере:

def speak(text):
    # Создаем объект gTTS с преобразуемым текстом
    tts = gTTS(text=text, lang="ru")

    # Сохраняем речь в файл
    tts.save("output.mp3")

    # Воспроизводим файл с помощью системной команды
    os.startfile("output.mp3")  # Открываем файл с помощью программы по умолчанию

5. Вызывайте функции recognize_speech() и speak() для распознавания команд и предоставления обратной связи на компьютере:

# Распознавание и выполнение команд
recognize_speech()

# Пример обратной связи на компьютере
speak("Команда принята")

Обратите внимание, что это только примерный код, и вы должны адаптировать его под свои нужды, используя подходящие команды для вашей операционной системы и целевых действий.

Оставьте комментарий