본문 바로가기

인공지능

음성인식

네이버 클라우드 플랫폼으로 이동해서 AI, Naver API에 Application을 등록한다.

CSR을 이용할 거고 서비스 환경 등록에서 웹이나 앱 등록하라고 할 텐데 굳이 등록 안해도 된다.

아무튼 등록하고 나면 인증 정보를 눌러서 Client ID와 Client Secret 키를 볼 수 있다.

import json
import requests

data = open("./test.m4a", "rb") # STT를 진행하고자 하는 음성 파일

Lang = "Kor" # Kor / Jpn / Chn / Eng
URL = "https://naveropenapi.apigw.ntruss.com/recog/v1/stt?lang=" + Lang

ID = "" # 인증 정보의 Client ID
Secret = "" # 인증 정보의 Client Secret

headers = {
    "Content-Type": "application/octet-stream", # Fix
    "X-NCP-APIGW-API-KEY-ID": ID,
    "X-NCP-APIGW-API-KEY": Secret,
}
response = requests.post(URL,  data=data, headers=headers)
rescode = response.status_code

if(rescode == 200):
    print (response.text)
else:
    print("Error : " + response.text)

그리고 나면 그냥 이렇게 파이썬 코드를 짜주면 된다.

테스트해본 결과, m4a 파일 말고 mp3도 된다.

이렇게 코드 짜고, 녹음 파일을 만들어서 코드 파일과 같은 폴더에 넣고, 실행시키면

이런 식으로 결과가 텍스트로 나온다.

 

'인공지능' 카테고리의 다른 글

카카오톡 전송 api 개발  (0) 2024.08.13
모두의 딥러닝 - 2장(처음 해 보는 딥러닝)  (1) 2024.07.17