AWS 기반 지식 없이 AWS로 시작하는 챗봇 구현
AWS Lex
로 구현하고 AWS에서 제공하는 대응 플랫폼(페이스북 메신저, 트윌리오 등)을 이용하여 배포하기AWS Lex
로 구현하고AWS Gateway API
를 이용하여 커스텀 UI(웹, 앱을 직접 제작하기 등)로 배포하기AWS Lambda
를 이용하여 대화 흐름을 Programming 하기AWS Lambda
와 DB (AWS DynamoDB
,AWS RDS
등)을 이용하여 원하는 데이터와 함께 Programming 하기- 등등 ...
이 안내서는 간단하면서도 많은 일을 할 수 있는 AWS Lex, Lambda, DynamoDB를 이용한 챗봇을 만들고, 페이스북 메신저에 배포하는 과정에 대해 설명합니다.
Lambda는 Python, Java, Node.js 를 지원하며 이 안내서는 Python 3.6을 사용하였습니다.
- Amazon Lex 와 Lambda 를 이용한 CoffeeBot 만들기
- AWS 공식 문서
Lex는 의도형 대화 로봇입니다. USER에게 보이고 싶은 대화흐름을 [의도 단위로 구성해 놓으면 그 의도에 맞춰 대화를 진행하게 됩니다. Lex는 [어터런스 구성을 통해 문장 속에서 특정 단어를 캐치하는 것을 매우 잘합니다. 아쉽게도 Lex는 현재 영어만 지원합니다.
예를 들어
의도1 : 피자를 시키고 싶다.
,의도2 : 호텔예약을 하고 싶다.
두 가지 의도로 구성한 뒤, 유저의 입력에 따라 둘 중 어떤 의도를 수행시킬지 정하고 이에 따라 해당 대화흐름만 진행하게끔 합니다. 이는 Amazon 알렉사나 Samgsung 빅스비처럼 여러가지 주제가 다른 명령에 대해 대답을 할 수 있음을 시사합니다.
Console은 AWS 웹페이지에서 제공하는 화면을 의미합니다.
그러면 이제 간단한 챗봇을 만들기 위해 AWS Lex
콘솔에 접속합시다.
인텐트는 의도입니다. 하나의 대화 흐름을 의미합니다.
User의 입력에 따라 여러가지 값들을 다 받을 것인지, 정해진 값만 받을 것인지 정하고 그에 대한 값들을 정의합니다.
- Slot Resolution
- Expand Values : Value에 적혀 있지 않은 값들도 받습니다.
- Restrict to Slot values and Synonyms : Value에 적혀 있는 값들만 받습니다. 이때 오른쪽에 있는 값들은 동의어(Synonyms)입니다. 한 단어를 작성하고 탭을 누르면 두번째 동의어를 작성할 수 있습니다. 이렇게 하나의 값에 대해 여러 동의어를 설정할 수 있습니다.
User의 입력에서 어떤 식으로 slot을 추출해 낼 지를 도와줍니다. 예를 들어 I would like to go to {slot_name_city} at {slot_name_time}
이라고 작성하면 이러한 문장을 User가 입력했을 때 대괄호에 있는 부분이 해당 slot
일 것이다 라고 Lex에게 힌트를 주게 됩니다. 어터런스를 많이 구성하면 보다 많은 유저의 불특정 입력에 대응할 수 있습니다.
하나의 인텐트가 가지는 대화흐름을 끝내기까지 몇 개의 slot이 요구되는지를 정의할 수 있습니다. 위 어터런스에서 대괄호 안에 들어가는 것은 slot type
이 아닌 slots
에 정의된 Name필드
임을 유의합니다.
Prompt : 해당 Slot의 값을 유저에게 얻기위해 어떤 문장으로 질문할 것인지 정합니다.
톱니바퀴를 클릭하면 해당 slot에 대한 어터런스도 구성할 수 있습니다. (Corresponding utterances)
단, 이러한 어터런스가 구성되어있다고 대화 흐름의 순서를 마음대로 바꿀 수 있는 것은 아닙니다. Lex만을 가지고 챗봇을 구성할 경우 대화는 차례대로 이루어집니다.
인텐트의 어터런스에 만족하지 않는 유저의 입력에 대한 핸들링이나, 슬롯의 어터런스에 만족하지 않거나 정해진 규칙(Restrict to Slot values and Synonyms)과 상이한 유저의 입력이 몇 번 이상일 때 대화를 종료할 지 정할 수 있습니다.
위 구성요소를 입맛에 맞게 채워놓고 우측 상단의 Build
를 클릭하면 우측 Test Chatbot
을 통해 테스트를 할 수 있습니다.
여기까지 진행이 되었다면 간단한 챗봇이 구성됩니다.
AWS Lambda
는 serverless 컴퓨팅을 제공하는 서비스입니다. 별도의 서버 없이 개발자가 정의한 함수만 수행될 수 있게 구성되어 있습니다. 개발자는 서버에 관한 지식 없이 Python
, Java
, Node.js
중 하나를 선택하여 프로그램을 작성할 수 있으며 정해진 파라미터로 입력을 받고 개발자가 작성한대로 실행됩니다. 본 문서는 Python 3.6을 사용하였습니다.
Lambda의 특징은 계속 서버가 살아있는 것이 아니라 수행될 때만 서버가 켜졌다가 함수가 종료되면 서버가 종료됩니다. 그러므로 Lambda 함수 내에서 계산된 변수들은 보존되지 않습니다.
-
AWS Lambda
콘솔에 접속합니다. -
함수생성 (블루 프린트로 생성하면 lex와 관련된 코드를 하드코딩하지 않아도 됩니다.)
이름 : 사용자가 임의로 지정
런타임 : 작성할 언어 지정
역할 : 정의한 역할을 선택합니다. 해당 역할은 Lambda가 맡을 수 있고 CloudWatch Logs 권한이 있어야 합니다.
- 역할 정의하기
AWS IAM
콘솔에 접속합니다.역할
탭 선택역할 만들기
신뢰할 수 있는 유형 개체
: Lambda 클릭 후 다음- Lambda, DynamoDB, Lex로 검색하여 각각 FullAccess를 하나씩 선택합니다.
- 이름과 설명을 설정하고 역할 만들기를 누릅니다.
- 역할 정의하기
Lex는 유저의 입력 하나하나 마다 Lambda 함수를 호출할 수 있습니다.
AWS Lex
콘솔에서Editor
탭의 임의의 인텐트를 하나 선택합니다.Lambda initialization and validation
에서 Initialization and validation code hook 체크- 정의한 Lambda 함수를 목록에서 선택합니다.
Lambda가 다른 AWS 서비스들과 통신하는 데 있어 정해진 약속입니다. 이 규격을 벗어난 데이터는 에러를 발생시킬 수 있습니다. 그러므로 개발자는 Event 데이터 형식에 맞게 데이터를 읽고, 규격에 맞게 리턴해주어야 합니다.
# lambda_handler : 람다의 메인함수
def lambda_handler(event, context):
event = ? # : 첫번째 파라미터인 event가 lex가 lambda한테 전달한 Event 데이터입니다.
# : Input Event 라고도 합니다.
return ? # : lambda가 lex한테 전달할 Event 데이터입니다.
# : Response 라고도 합니다.
Reference : AWS 공식 문서
해당 형식은 언제든지 바뀔 수 있습니다. 이는 "messageVersion": "값" 에 좌우합니다.
# Input Event Format
{
"currentIntent": {
"name": "intent-name",
"slots": {
"slot name": "value",
"slot name": "value"
},
"slotDetails": {
"slot name": {
"resolutions" : [
{ "value": "resolved value" },
{ "value": "resolved value" }
],
"originalValue": "original text"
},
"slot name": {
"resolutions" : [
{ "value": "resolved value" },
{ "value": "resolved value" }
],
"originalValue": "original text"
}
},
"confirmationStatus": "None, Confirmed, or Denied (intent confirmation, if configured)"
},
"bot": {
"name": "bot name",
"alias": "bot alias",
"version": "bot version"
},
"userId": "User ID specified in the POST request to Amazon Lex.",
"inputTranscript": "Text used to process the request",
"invocationSource": "FulfillmentCodeHook or DialogCodeHook",
"outputDialogMode": "Text or Voice, based on ContentType request header in runtime API request",
"messageVersion": "1.0",
"sessionAttributes": {
"key": "value",
"key": "value"
},
"requestAttributes": {
"key": "value",
"key": "value"
}
}
# Response Format
{
"sessionAttributes": {
"key1": "value1",
"key2": "value2"
...
},
"dialogAction": {
"type": "ElicitIntent, ElicitSlot, ConfirmIntent, Delegate, or Close",
Full structure based on the type field. See below for details.
}
}
dialogAction 에 대한 자세한 구조는 공식 문서를 참고바랍니다. 우측 상단에서 언어를 선택할 수 있습니다.
보다 쉬운 이해를 위해 Lex Input Event가 어떻게 전달되는지 눈으로 직접 확인할 수 있는 예제입니다.
def lambda_handler(event, context):
return {
'sessionAttributes': '',
'dialogAction': {
'type': 'Close',
'fulfillmentState' : 'Failed',
'message' : {
'contentType': 'PlainText',
'content': str(event),
}
}
}
위 코드를 Lambda 함수에 작성하고 Lex 콘솔에서 대화를 해보세요.
이제 Lex에 Lambda를 올릴 수 있게 되었습니다.
AWS DynamoDB
는 NoSQL형태의 구조를 가지는 데이터베이스 서비스입니다. 때문에 sql 관련 지식 없이도 쉽게 사용할 수 있다는 장점이 있습니다. 구조는 다음과 같은 JSON 구조를 띕니다.
{
"Disease": {
"S": "질병명"
},
"Symptoms": {
"L": [
{
"S": "증상1"
},
{
"S" : "증상2"
}
]
}
}
S는 String, L은 List 를 나타내며 AWS DynamoDB
콘솔에서 편리한 UI를 제공하므로 자료 입력시 마다 직접 위와 같이 하드 타이핑을 할 필요는 없습니다.
위 Lex와 Lambda는 호출하고 리턴하는 관계(Caller와 Callee의 관계) 입니다. 그래서 별도의 스킬 없이 파라미터와 리턴 값을 이용하여 정보를 주고받게 됩니다. 그렇기 때문에 그 이외 제 3의 아마존 서비스를 사용하려면 별도의 기능이 필요합니다. 이러한 기능을 제공해주는 라이브러리를 AWS SDK
라고 부르며 Python에서는 boto3
이라고도 부릅니다.
DynamoDB를 호출하기 위해서 먼저 AWS DynamoDB
에서 테이블을 만들고, 데이터를 넣습니다. 다음 코드는 DB내용 전체를 Lex에서 출력하는 예제입니다.
# import boto3
# Lambda에서는 boto3을 import할 필요가 없습니다. 자동으로 선언되어있습니다.
def call_my_dynamo_records():
myddb = boto3.client('dynamodb')
response = myddb.scan(
TableName='테이블이름' # 생성한 테이블 이름으로 바꿔주어야 합니다.
)
# print(response["Items"][0])
return response
def lambda_handler(event, context):
db = call_my_dynamo_records()
return {
'sessionAttributes': '',
'dialogAction': {
'type': 'Close',
'fulfillmentState' : 'Failed',
'message' : {
'contentType': 'PlainText',
'content': str(db),
}
}
}
위 boto3의 scan함수가 원활하게 작동하기 위해서는 해당 Lambda 함수의 권한에 DynamoDB 읽기 권한이 포함되어있어야 합니다. 위 Lambda를 정의할 때 DynamoDB에 대한 Access 권한을 주지 않았다면 Lambda가 가지는 Role(실행 역할)을 AWS IAM
콘솔에서 수정합니다.
-
AWS IAM
콘솔 접속 -
좌측
역할
탭 선택 및 우측에서해당 역할 선택
-
인라인 정책 추가
-
서비스 : DynamoDB
-
작업 : 읽기 체크
Scan 함수만 사용한다면 Scan만 체크해도 무방합니다.
-
권한 추가
reference : AWS 공식 문서, Facebook 공식 문서
-
페이스북 페이지
를 생성합니다. -
페이스북 개발자 페이지에서
앱 추가
를 합니다. -
페이스북에서 2가지 정보를 생성하고 받아야 합니다.
대시보드
-앱 시크릿 코드
제품추가
-Messenger
-토큰 생성
-페이지 액세스 토큰
-
AWS Lex
의Channels
탭에서Facebook
을 클릭하고 작성합니다.KMS Key : aws/lex
Alias : Lex를 Publish했을 때 설정한 Alias
Verify Token : 임의로 지정 가능하나, 꼭 기억하고 있어야 함.
Page Access Token : 페이스북 페이지 액세스 토큰
App Secret Key : 페이스북 앱 시크릿 키
-
다시
페이스북 개발자 페이지
로 돌아가Webhooks
를 설정합니다.- 선택된 이벤트 : messages, messaging_postbacks, messaging_optins 체크
- Callback URL 추가
- Verify Token (AWS에서 작성한) 추가
-
페이스북 페이지
로 돌아가서Messenger 플랫폼
탭의응답 방법
을자동
으로 설정합니다. -
하단
앱 역할
을primary receiver
로 수정합니다. -
자신의
페이스북 페이지
와 메신저로 대화해봅니다.
세션속성은 key와 value로 매칭된 Map 구조로 이루어져 있고 value는 String이나 Int 같은 단일 자료형입니다. 때문에 tuple, list, dict 등을 사용하는 데 있어 제약을 받게 됩니다. 이때 ast.literal_eval
을 사용하면 쉽게 다중 자료형을 세션으로 사용할 수 있습니다.
이 함수는 문자열로 된 파이썬 구문을 파이썬 구문으로 치환해주는 역할을 합니다.
아래 예제는 세션에 리스트를 만들어 대화를 한 번 할 때마다 'item'
을 한 번씩 넣어주는 예제입니다.
import ast
def lambda_handler(event, context):
if 'my_list' in event['sessionAttributes'] :
my_list = ast.literal_eval(event['sessionAttributes']['my_list'])
else :
my_list = []
# 이 자료형을 session에 넣을 때는 '[]' 와 같이 들어가야 합니다.
# 이 문자열 '[]'를 literal_eval 함수로 [] 와 같이 리스트로 만들 수 있습니다.
my_list.append('item')
event['sessionAttributes']['my_list'] = str(my_list)
return {
'sessionAttributes': event['sessionAttributes'],
'dialogAction': {
'type': 'ElicitSlot',
'message' : {
'contentType': 'PlainText',
'content': str(my_list),
},
'intentName' : event['currentIntent']['name'],
'slots' : event['currentIntent']['slots'],
'slotToElicit' : 'slot' # Lex에서 정의한 slot이름으로 바꿔주어야 합니다.
}
}
단, Lex가 읽는 Event 크기는 25K를 초과할 수 없으므로 이에 유의하여 대용량의 자료를 세션에 넣는 것은 피하시기 바랍니다.
-
CloudWatch 서비스에 들어갑니다.
-
왼쪽 탭에 로그를 클릭합니다.
-
로그 그룹 중 해당되는 그룹을 선택합니다.
-
가장 위에 있는 (최신) 로그스트림을 확인합니다.
-
스크롤을 내립니다.
비정상 종료, SDK 외부 서비스 호출, print 함수 출력물 등을 확인할 수 있습니다.
바로 반영이 되지 않는 경우가 있으니 원하는 로그가 나올때까지 스크롤을 올렸다 내렸다 반복하세요.
- Event 데이터 형식에 맞지 않게 Response를 Lex에 return 할 경우
- Lambda 함수가 비정상으로 종료되어 Return 된 경우
- TypeError, IndexError, etc...
An error has occurred: Invalid Lambda Response: Lambda response exceeds maximum size (27509 vs. 25K)
Response 길이가 25K 이상인 경우
stackoverflow나 구글링을 통해 알아봅니다.
-
해당 문제는 boto3을 사용하고 있는 중, 물음표가 문제를 일으키는 경우입니다.
이렇게 쉽게 알 수 없는 에러들에 대해서 발견 후 해당 문서에 기여해주시면 감사하겠습니다.
본 문서에서 안내하는 aws lex console - lambda 간에는 해당 문제와 같은 물음표 문제가 발생하지 않음.
문서의 질을 향상시키기 위해 기여하기(contribution)을 장려합니다.
틀린 정보가 있다면 피드백 부탁드립니다.
-
문서기여 : 해당 프로젝트를 Fork하여 문서를 수정하고 Pull Request를 요청합니다.
-
응원 : 더 많은 사람이 볼 수 있게 Star를 누릅니다.