다국어 봇의 경우, 봇의 동작은 언어에 따라 달라지지 않지만, 언어 시맨틱에 따라 몇 가지 제한이 있습니다. 본 문서에서는 언어에 따라 다르게 동작할 수 있는 다양한 행동을 나열하여 봇 개발자가 이러한 상황에 대처할 수 있도록 합니다.
패턴 지원
본 문서에서는 의도 감지 및 엔티티 추출을 위해 패턴이 어떻게 사용될 수 있는지 살펴보았습니다. 이러한 규칙은 영어 봇에 적용됩니다. 다국어 봇은 이러한 규칙을 따르지만, 언어 시맨틱에 따라 몇 가지 제한이 있습니다. 또한 패턴을 스몰 토크(쿼리를 정의하는 동안), Knowledge Graph (KG)(대체 질문 필드 사용) 및 특성 식별에서도 사용할 수 있지만 그 행동이 약간 다를 수 있습니다.
패턴 구문 | 의도 감지 및 요소 추출 | 스몰 토크 | 특성 | Knowledge graph(KG) | |
---|---|---|---|---|---|
지원되는 언어 | 지원되지 않는 언어 | ||||
word1 word2…wordn 이는 사용하면 정의된 모든 단어가 동일한 연속 순서로 사용자 발화에서 사용할 수 있도록 정의되며 앞, 뒤 사이에 추가 단어가 허용되도록 위임합니다. | 모든 언어 | – | 예 | 예 | 예 |
word1_word2 구문을 적용합니다. word1과 word2 사이에 추가 단어가 허용되지 않습니다. | 모든 언어 | – | 예 | 예 | 예 |
word1 * word2 0에서 지정한 단어/구 사이에 추가 단어 수를 무제한으로 지정할 수 있습니다 | 모든 언어 | – | 예 | 예 | 예 |
word1 * n word2 지정한 단어/구 사이에 정확히 n 개의 추가 단어가 있습니다 | 모든 언어 | – | 예 | 예 | 예 |
word1 * 0 word2 두 토큰 사이의 와일드카드를 비활성화합니다. | 모든 언어 | – | 예 | 예 | 예 |
word1 < word2 word2 의 일치 항목이 문장의 시작 부분부터 시작됨을 나타냅니다. | 모든 언어 | – | 예 | 예 | 예 |
word1> word2 문장의 끝을 나타내며 뒤에 단어를 사용할 수 없습니다. | 모든 언어 | – | 예 | 예 | 예 |
!abc 이 토큰 이후의 사용자 발화 어디에도 단어/개념 "abc"가 존재하지 않아야 함을 나타냅니다 | 모든 언어 | – | 예 | 예 | 예 |
!!abc 바로 다음 단어/개념은 "abc"가 아니어야 합니다. | 모든 언어 | – | 예 | 예 | 예 |
[ … ] 단어/개념 그룹을 정의하는 데 사용되며 [ ]에서 선언된 그룹 중 하나와 정확히 일치해야 합니다. | 모든 언어 | – | 예 | 예 | 예 |
{ … } 선택적 그룹 또는 단어/개념을 정의하는 데 사용되며, 일치 값은 { }에 선언된 단어/패턴 중 하나 또는 0에 대한 것입니다. | 모든 언어 | – | 예 | 예 | 예 |
( … ) 에는 패턴이 포함되어 있습니다. 즉, 패턴이나 패턴의 일부가 이러한 괄호 안에 있으면 [ ] 및 { }와는 다른 패턴으로 취급됩니다. | 모든 언어 | – | 예 | 예 | 예 |
<< … >> 모든 순서로 단어를 찾는 데 사용됩니다 | 모든 언어 | – | 예 | 예 | 예 |
'word1 단어를 인용하거나 정식 형식이 아닌 단어를 사용하면 시스템이 자체적으로 패턴에서 사용한 것으로 제한합니다 | 영어, 독일어, 스페인어, 프랑스어 | 포르투갈어(브라질어), 이탈리아어, 중국어 간체자, 중국어 번체자, 인도네시아어, 한국어, 네덜란드어, 일본어, 아랍어, 핀란드어, 러시아어, 폴란드어, 우크라이나어, 스웨덴어, 카자흐어, 노르웨이어, 힌디어, 텔루구어, 타밀어, 마라티어, 카탈로니아어 | 아니요 | 아니요 | 아니요 |
시스템 콘셉트 내장된 콘셉트를 지원합니다 | 영어, 독일어, 스페인어, 프랑스어 | 포르투갈어(브라질어), 이탈리아어, 중국어 간체자, 중국어 번체자, 인도네시아어, 한국어, 네덜란드어, 일본어, 아랍어, 핀란드어, 러시아어, 폴란드어, 우크라이나어, 스웨덴어, 카자흐어, 노르웨이어, 힌디어, 텔루구어, 타밀어, 마라티어, 카탈로니아어 | 아니요 | 아니요 | 아니요 |
개발자 콘셉트 개발자 정의 콘셉트에 대한 지원 | 영어, 독일어, 스페인어, 프랑스어, 포르투갈어(브라질어)*, 이탈리아어*, 중국어 간체자*, 중국어 번체자*, 인도네시아어*, 한국어*, 네덜란드어*, 일본어*, 아랍어*, 핀란드어*, 러시아어*, 폴란드어*, 우크라이나어*, 스웨덴어*, 카자흐어*, 노르웨이어*, 힌디어*, 텔구르어*, 타밀어*, 마라티어*, 카탈로니아어* | – | 예 | 예 | 예* |
날짜를 나타내는 두 글자로 된 식별자 월요일은 Mo, 화요일은 Tu 등 | 영어, 독일어, 스페인어, 포르투갈어(브라질어), 이탈리아어, 중국어 간체자, 중국어 번체자, 인도네시아어, 한국어, 네덜란드어, 일본어, 아랍어, 핀란드어, 러시아어, 폴란드어, 우크라이나어, 스웨덴어, 카자흐어, 노르웨이어, 힌디어 | 프랑스어, 텔루구어, 타밀어, 마라티어, 카탈로니아어 | – | – | 아니요 |
* 이러한 경우 개발자 콘셉트는 엔티티 추출에서 지원되지 않습니다
NLP 지원
NLP 기능 및 지원 목록을 여기 나열합니다.
NLP 기능 | 지원되는 언어 | 지원되지 않는 언어 | 스몰 토크 | 특성 | Knowledge Graph(KG) |
---|---|---|---|---|---|
값 목록 | |||||
완전 일치 | 모든 언어 | – | – | – | 아니요 |
부분 일치 | 모든 언어 | – | – | – | 아니요 |
완전 일치 | 모든 언어 | – | – | – | 아니요 |
모호한 동작 | 모든 언어 | – | – | – | 아니요 |
여러 항목을 선택할 시 모호성 | 영어 | 영어를 제외한 모든 언어에서 지원되지 않음 | – | – | 아니요 |
맞춤법 수정 | 영어, 독일어, 스페인어, 프랑스어, 포르투갈어(브라질어), 이탈리아어, 인도네시아어, 한국어(버전7.3부터), 네덜란드어, 아랍어, 핀란드어, 러시아어 폴란드어, 우크라이나어, 스웨덴어, 카자흐어, 노르웨이어 | 중국어 간체자, 중국어 번체자, 일본어, 힌디어, 텔루구어, 타밀어, 마라티어 | – | – | 예 |
엔티티 수정 | 영어 | 영어를 제외한 모든 언어에서 지원되지 않음 | – | – | 예 |
정서 분석 | 영어, 독일어, 스페인어, 프랑스어, 네덜란드어, 한국어(버전 7.3부터), 일본어(버전 8.0부터), 러시아어 (버전 8.0부터), 카자흐어(버전 8.0부터), 노르웨이어 | 포르투갈어 (브라질어), 이탈리아어, 중국어 간체자, 중국어 번체자 인도네시아어, 아랍어, 핀란드어, 폴란드어, 우크라이나어, 스웨덴어, 힌디어, 텔루구어, 타밀어, 마라티어, 카탈로니아어 | – | – | 예 |
봇 동의어 (기본값) | 영어, 독일어, 스페인어, 프랑스어 | 포르투갈어 (브라질어), 이탈리아어, 중국어 간체자, 중국어 번체자 인도네시아어, 한국어, 네덜란드어, 일본어, 아랍어, 핀란드어, 러시아어 폴란드어, 우크라이나어, 스웨덴어, 카자흐어 | – | – | 예 |
Knowledge Graph (KG) | |||||
패턴 | 모든 언어 | – | – | – | 예 |
답변에서 검색 | 영어, 독일어(버전 7.3 이상), 스페인어(버전 7.3 이상), 프랑스어(버전 7.3 이상), 포르투갈어(브라질어)(버전 7.3 이상), 이탈리아어(버전7.3 이상), 인도네시아어(버전7.3 이상), 네덜란드어(버전7.3 이상), 핀란드어(버전7.3 이상), 폴란드어(버전7.3 이상), 스웨덴어(버전7.3부터), | 중국어 간체자, 중국어 번체자, 한국어, 일본어, 아랍어, 러시아어, 우크라이나어, 카자흐어 | – | – | 예 |
맞춤법 수정 | 영어, 독일어, 스페인어, 프랑스어, 포르투갈어(브라질어), 이탈리아어, 인도네시아어, 한국어, 네덜란드어, 아랍어, 핀란드어, 폴란드어, 스웨덴어, 우크라이나어 러시아어(버전 8.0 이상), 카자흐어(버전 8.0 이상), 일본어(버전 8.0 이상), | 중국어 간체자, 중국어 번체자, 카탈로니아어 | – | – | 예 |
특수 문자 지원 | 영어를 제외한 모든 언어 | 영어 | – | – | 예 |
NL 엔진 | |||||
종속성 파서 모델 | 독일어(버전7.3 이상), 프랑스어(버전7.3 이상), 이탈리아어(버전8.0 이상) | 영어, 스페인어, 포르투갈어(브라질어), 중국어 간체자, 중국어 번체자 인도네시아어, 한국어, 네덜란드어, 일본어, 아랍어, 핀란드어, 러시아어 폴란드어, 우크라이나어, 스웨덴어, 카자흐어, 노르웨이어, 힌디어 | – | – | – |
범용 봇 지원
여기에서는 범용 봇(여기 참조)을 지원하는 언어로 학습하는 데 사용되는 트리거 문구를 언어별로 나열합니다.
구문 | 언어 지원 | ||||||
---|---|---|---|---|---|---|---|
영어 | 독일어 | 스페인어 | 프랑스어 | 포르투갈어(브라질어) | 이탈리아어 | 중국어 간체자 | 중국어 번체자 |
Ask | Fragen | Pedir | Demander | perguntar | Chiedi | 问 | 問 |
Tell | Sagen | Contar | Dire | Contar | Raccontare | 告诉 | 告訴 |
Search | Suche | Buscar | Chercher | Procurar | Ricerca | 搜索 | 搜索 |
Open | Öffnen | Abierto | Ouvert | Aberto | Aperto | 打开 | 打開 |
Load | Belastung | Carga | Charge | Carga | Caricare | 加载 | 加載 |
Begin | Start | Empezar | Commencer | Início | Inizio | 开始 | 開始 |
Launch | Starten | Lanzamiento | lancement | Lançamento | Lanciare | 发射 | 發射 |
Talk to | Reden mit | Hablar con | Parler à | Falar com | Parlare a | 交谈 | 交談 |
Run | Lauf | correr | Courir | Corre | Correre | 跑 | 跑 |
Exit | ausgang | salida | sortie | saída | uscita | 出口 | 出口 |
Phrase | 언어 지원 | ||||||
---|---|---|---|---|---|---|---|
영어 | 인도네시아어 | 한국어 | 네덜란드어 | 일본어 | 아랍어 | 핀란드어 | 러시아어 |
Ask | Meminta | 물어보기 | Vragen | 頼みます | يطلب | Kysyä | Спросить |
Tell | Menceritakan | 텔 | Vertellen | 伝えます | يخبار | Kertoa | сказать |
Search | Cari | 검색 | Zoeken | 探す | بحث | Hae | Поиск |
Open | Buka | 열다 | Open | 開いた | افتح | Avata | открыто |
Load | Beban | 하중 | Laden | 負荷 | حمل | Ladata | нагрузка |
Begin | Mulai | 시작 | Beginnen | ベギン | ابدأ | Alkaa | Начать |
Launch | Meluncurkan | 시작하다 | Lancering | 打ち上げ | إطلاق | Tuoda markkinoille | запуск |
Talk to | Berbicara dengan | 로 토크 | Praten met | に話す | تحدث الي | Puhua | Говорить с |
Run | Lari | 운영 | Rennen | ラン | يركض | Juosta | Запустить |
Exit | keluar | 출구 | uitgang | 出口 | خروج | poistuminen | выход |
Phrase | 언어 지원 | |||
---|---|---|---|---|
영어 | 폴란드어 | 우크라이나어 | 스웨덴어 | 카자흐스탄어 |
Ask | Zapytać | запитати | Fråga | сұрау |
Tell | Powiedzieć | сказати | Säga | Tell |
Search | Szukaj | Пошук | Sök | іздеу |
Open | otwarty | відчинено | Öppna | ашық |
Load | Załaduj | навантаження | Ladda | жүк |
Begin | Zaczynać | почати | Börja | Баста |
Launch | Uruchomić | запуск | Lansera | ұшыру |
Talk to | Mówić do | Розмовляти з | Prata med | Сөйлесу |
Run | Biegać | пробіг | Springa | жүгіру |
Exit | wyjście | вихід | utgång | шығу |
多言語ボットの場合、ボットの動作の多くは言語によって変わることはありませんが、言語セマンティクスによっては、いくつかの制限が出てきます。この文書では、言語に依存するさまざまな動作をリストアップし、ボット開発者がそのようなシナリオに対応できるようにします。
パターン構文 | インテントの検出とエンティティの抽出 | スモールトーク | 特性 | ナレッジグラフ | |
---|---|---|---|---|---|
言語でサポート | 言語で非サポート | ||||
単語1 単語2 … 単語n これは、定義されたすべての単語がユーザー発話の中で同じ連続した順序で使用可能であることを義務付けるもので、その間、前、後に追加の単語が許可されます | すべての言語 | – | はい | はい | はい |
word1_word2単語1と単語2の間に追加の単語を入れてはいけないという強制フレーズ。 | すべての言語 | – | はい | はい | はい |
word1 * word2 指定した単語/フレーズの間に追加する単語数は0~無限大 | すべての言語 | – | はい | はい | はい |
word1 *n word2 指定された単語/フレーズの間にある正確にn個の追加単語 | すべての言語 | – | はい | はい | はい |
word1 *0 word2 2つのトークンの間のワイルドカードを無効にすること。 | すべての言語 | – | はい | はい | はい |
word1 < word2 単語2の一致が文の先頭から始まることを示す。 | すべての言語 | – | はい | はい | はい |
word1 > word2 文の終わりを示し、それ以降の単語は許可されない。 | すべての言語 | – | はい | はい | はい |
!abc単語/概念「abc」は、このトークンの後のユーザー発話のどこにも存在してはならないことを示します | すべての言語 | – | はい | はい | はい |
!!abc次の単語/概念は「abc」であってはなりません | すべての言語 | – | はい | はい | はい |
[ …] 単語/概念のグループを定義するために使用され、一致は[ ]で宣言されたグループの正確に1つだけに対するものでなければなりません。 | すべての言語 | – | はい | はい | はい |
{ …} 任意のグループまたは単語/概念を定義するために使用され、一致は、{ }で宣言された単語/パターンのうちゼロまたは1つに対してなされます。 | すべての言語 | – | はい | はい | はい |
( …)にはパターンが含まれている。つまり、パターンまたはパターンの一部がこれらの括弧で囲まれている場合、[ ] と { } とは異なり、パターンとして扱われます。 | すべての言語 | – | はい | はい | はい |
<< …>> 任意の順序で単語を検索するのに使用されます | すべての言語 | – | はい | はい | はい |
'word1 単語を引用したり、正規形式ではない単語を使用した場合、システムはパターンで使用したものに制限されます | 英語、ドイツ語、スペイン語、フランス語 | ポルトガル語(ブラジル)、イタリア語、中国語(簡体字)、中国語(繁体字)、インドネシア語、韓国語、オランダ語、日本語、アラビア語、フィンランド語、ロシア語、ポーランド語、ウクライナ語、スウェーデン語、カザフ語、ノルウェー語、ヒンディー語、テルグ語、タミル語、マラーティー語、カタロニア語 | いいえ | いいえ | いいえ |
システム概念ビルトイン概念のサポート | 英語、ドイツ語、スペイン語、フランス語 | ポルトガル語(ブラジル)、イタリア語、中国語(簡体字)、中国語(繁体字)、インドネシア語、韓国語、オランダ語、日本語、アラビア語、フィンランド語、ロシア語、ポーランド語、ウクライナ語、スウェーデン語、カザフ語、ノルウェー語、ヒンディー語、テルグ語、タミル語、マラーティー語、カタロニア語 | いいえ | いいえ | いいえ |
開発者の概念 開発者が定義した概念のサポート | 英語、ドイツ語、スペイン語、フランス語、ポルトガル語(ブラジル)*、イタリア語*、中国語(簡体字)*、中国語(繁体字)*、インドネシア語*、韓国語*、オランダ語*、日本語*、アラビア語*、フィンランド語*、ロシア語*、ポーランド語*、ウクライナ語*、スウェーデン語*、カザフ語*、ノルウェー語*、ヒンディー語*、テルグ語*、タミル語*、マラーティー語*、カタロニア語* | – | はい | はい | はい* |
月曜はMo、火曜はTuなど、日付を表す2文字の識別子 | 英語、ドイツ語、スペイン語、ポルトガル語(ブラジル)、イタリア語、中国語(簡体字)、中国語(繁体字)、インドネシア語、韓国語、オランダ語、日本語、アラビア語、フィンランド語、ロシア語、ポーランド語、ウクライナ語、スウェーデン語、カザフ語、ノルウェー語、ヒンディー語 | フランス語、テルグ語、タミル語、マラーティー語、カタロニア語 | – | – | いいえ |
* このような場合、開発者の概念はエンティティ抽出ではサポートされません。
NLPサポート
ここでは、NLPの機能とそのサポートについて列挙します。
NLP機能 | 言語でサポート | 言語で非サポート | スモールトーク | 特性 | ナレッジグラフ |
---|---|---|---|---|---|
値のリスト | |||||
完全一致 | すべての言語 | – | – | – | いいえ |
部分一致 | すべての言語 | – | – | – | いいえ |
完全一致 | すべての言語 | – | – | – | いいえ |
曖昧な動作 | すべての言語 | – | – | – | いいえ |
複数項目選択の曖昧さ | 英語 | 英語以外の言語には対応していません。 | – | – | いいえ |
スペルの修正 | 英語、ドイツ語、スペイン語、フランス語、ポルトガル語(ブラジル)、イタリア語、インドネシア語、韓国語(Ver7.3以降)、オランダ語、アラビア語、フィンランド語、ロシア語ポーランド語、ウクライナ語、スウェーデン語、カザフ語、ノルウェー語 | 中国語簡体字、中国語繁体字、日本語、ヒンディー語、テルグ語、タミル語、マラーティー語 | – | – | はい |
エンティティを変更 | 英語 | 英語以外の言語には対応していません。 | – | – | はい |
センチメント分析 | 英語、ドイツ語、スペイン語、フランス語、オランダ語、韓国語(ver7.3より)、日本語(ver8.0より)、ロシア語(ver8.0より)、カザフ語(ver8.0より)、ノルウェー語 | ポルトガル語(ブラジル)、イタリア語、中国語(簡体字)、中国語(繁体字)、インドネシア語、アラビア語、フィンランド語、ポーランド語、ウクライナ語、スウェーデン語、ヒンディー語、テルグ語、タミル語、マラーティー語、カタロニア語 | – | – | はい |
ボット同義語(デフォルト) | 英語、ドイツ語、スペイン語、フランス語 | ポルトガル語(ブラジル)、イタリア語、中国語(簡体字)、中国語(繁体字)、インドネシア語、韓国語、オランダ語、日本語、アラビア語、フィンランド語、ロシア語、ポーランド語、ウクライナ語、スウェーデン語、カザフ語 | – | – | はい |
ナレッジグラフ | |||||
パターン | すべての言語 | – | – | – | はい |
回答で検索 | 英語、ドイツ語(ver7.3より)、スペイン語(ver7.3より)、フランス語(ver7.3より)、ポルトガル語(ブラジル)(ver7.3より)、イタリア語(ver7.3より)、インドネシア語(ver7.3より)、オランダ語(ver7.3より)、フィンランド語(ver7.3より)、ポーランド語(ver7.3より)、スウェーデン語(ver7.3より)の各言語に対応しています。 | 中国語簡体字、中国語繁体字、韓国語、日本語、アラビア語、ロシア語、ウクライナ語、カザフ語 | – | – | はい |
スペルの修正 | 英語、ドイツ語、スペイン語、フランス語、ポルトガル語(ブラジル)、イタリア語、インドネシア語、韓国語、オランダ語、アラビア語、フィンランド語、ポーランド語、スウェーデン語、ウクライナ語 ロシア語(ver8.0以降)、カザフ語(ver8.0以降)、日本語(ver8.0以降)。 | 中国語簡体字、中国語繁体字、カタロニア語 | – | – | はい |
特殊文字サポート | 英語以外のすべての言語 | 英語 | – | – | はい |
NLエンジン | |||||
依存パーサーモデル | ドイツ語(ver7.3より)、フランス語(ver7.3より)、イタリア語(ver8.0より) | 英語、ドイツ語、スペイン語、ポルトガル語(ブラジル)、イタリア語、中国語(簡体字)、中国語(繁体字)、インドネシア語、韓国語、オランダ語、日本語、アラビア語、フィンランド語、ロシア語、ポーランド語、ウクライナ語、スウェーデン語、カザフ語、ノルウェー語、ヒンディー語 | – | – | – |
ユニバーサルボットのサポート
ここでは、ユニバーサルボット(こちらをご覧ください)のトレーニングで使用したトリガーフレーズを、対応する言語ごとにリストアップします。
フレーズ | 言語サポート | ||||||
---|---|---|---|---|---|---|---|
英語 | ドイツ語 | スペイン語 | フランス語 | ポルトガル語(ブラジル) | イタリア語 | 中国語簡体字 | 中国語繁体字 |
許可を得る | Fragen | Pedir | デマンダー | perguntar | Chiedi | 问 | 問 |
伝える | Sagen | Contar | Dire | Contar | Raccontare | 告诉 | 告訴 |
検索 | Suche | Buscar | Chercher | Procurar | Ricerca | 搜索 | 搜索 |
開く | Öffnen | Abierto | Ouvert | Aberto | Aperto | 打开 | 打開 |
読み込む | Belastung | Carga | 課金 | Carga | Caricare | 加载 | 加載 |
始める | 開始する | Empezar | Commencer | Início | Inizio | 开始 | 開始 |
稼働 | Starten | Lanzamiento | lancement | Lançamento | Lanciare | 发射 | 發射 |
と会話 | Reden mit | Hablar con | Parler à | Falar com | Parlare a | 交谈 | 交談 |
実行 | Lauf | correr | Courir | Corre | Correre | 跑 | 跑 |
終了 | ausgang | salida | sortie | saída | uscita | 出口 | 出口 |
フレーズ | 言語サポート | ||||||
---|---|---|---|---|---|---|---|
英語 | インドネシア語 | 韓国語 | オランダ語 | 日本語 | アラビア語 | フィンランド語 | ロシア語 |
許可を得る | Meminta | 물어보기 | Vragen | 頼みます | يطلب | Kysyä | Спросить |
伝える | Menceritakan | 텔 | Vertellen | 伝えます | يخبار | Kertoa | сказать |
検索 | Cari | 검색 | Zoeken | 探す | بحث | Hae | Поиск |
開く | Buka | 열다 | 開く | 開いた | افتح | Avata | открыто |
読み込む | Beban | 하중 | Laden | 負荷 | حمل | Ladata | нагрузка |
始める | Mulai | 시작 | Beginnen | ベギン | ابدأ | Alkaa | Начать |
稼働 | Meluncurkan | 시작하다 | Lancering | 打ち上げ | إطلاق | Tuoda markkinoille | запуск |
と会話 | Berbicara dengan | 로 토크 | Praten met | に話す | تحدث الي | Puhua | Говорить с |
実行 | Lari | 운영 | Rennen | ラン | يركض | Juosta | Запустить |
終了 | keluar | 출구 | uitgang | 出口 | خروج | poistuminen | выход |
フレーズ | 言語サポート | |||
---|---|---|---|---|
英語 | ポーランド語 | ウクライナ | スウェーデン語 | カザフ語 |
許可を得る | Zapytać | запитати | Fråga | сұрау |
伝える | Powiedzieć | сказати | Säga | 伝える |
検索 | Szukaj | Пошук | Sök | іздеу |
開く | otwarty | відчинено | Öppna | ашық |
読み込む | Załaduj | навантаження | Ladda | жүк |
始める | Zaczynać | почати | Börja | Баста |
稼働 | Uruchomić | запуск | Lansera | ұшыру |
と会話 | Mówić do | Розмовляти з | Prata med | Сөйлесу |
実行 | Biegać | пробіг | Springa | жүгіру |
終了 | wyjście | вихід | utgång | шығу |
Leave a Reply
In the case of multi-lingual bots, while much of the bot behavior does not change with the language, but the language semantics does impose some restrictions. In this document we will list out the different behaviors that would be language-dependent, so you as bot developer can cater for such scenarios.
Pattern Support
We have seen in this document, how Patterns can be used for Intent detection and Entity extraction. Those rules are for bots in the English language. Though the multilingual bots honor those rules, the language semantics impose some restrictions.
Also, patterns can also be used in Small Talk (while defining queries), Knowledge Graph (using alternate question field), and Trait identification but their behavior might differ slightly.
Pattern Syntax | Intent detection and Entity extraction | Small Talk |
Traits | Knowledge Graph |
|
---|---|---|---|---|---|
Supported in Languages | Not Supported in Languages | ||||
word1 word2 … wordn This mandates all the words defined to be available in the user utterance in the same consecutive order with additional words allowed in between, before and after |
All languages | – | Yes | Yes | Yes |
word1_word2 Enforce phrase, no additional words allowed in between word1 and word2. |
All languages | – | Yes | Yes | Yes |
word1 * word2 0 to infinite number of additional words between the specified words/phrases |
All languages | – | Yes | Yes | Yes |
word1 *n word2 Exactly n number of additional words between the specified words/phrases |
All languages | – | Yes | Yes | Yes |
word1 *0 word2 To disable wildcards between two tokens. |
All languages | – | Yes | Yes | Yes |
word1 < word2 Indicates the match for word2 should start from the beginning of a sentence. |
All languages | – | Yes | Yes | Yes |
word1 > word2 Indicates the end of the sentence and no words are allowed after it. |
All languages | – | Yes | Yes | Yes |
!abc Indicates the word/concept “abc” should not exist anywhere in the user utterance after this token |
All languages | – | Yes | Yes | Yes |
!!abc The very next word/concept should not be “abc” |
All languages | – | Yes | Yes | Yes |
[ … ] Used to define a group of words/concepts and the match should be against exactly one of the group declared in [ ]. |
All languages | – | Yes | Yes | Yes |
{ … } Used to define an optional group or words/concepts and the match would be against zero or one of the words/patterns declared in { }. |
All languages | – | Yes | Yes | Yes |
( … ) contain a pattern i.e when a pattern or part of a pattern is enclosed in these parentheses, we treat it as a pattern unlike [ ] and { }. |
All languages | – | Yes | Yes | Yes |
<< … >> Used to find words in any order |
All languages | – | Yes | Yes | Yes |
‘word1 If you quote words or use words that are not in canonical form, the system will restrict itself to what you used in the pattern |
English, German, Spanish, French |
Portuguese(Brazilian), Italian, Chinese simplified, Chinese traditional, Indonesian, Korean, Dutch, Japanese, Arabic, Finnish, Russian, Polish, Ukrainian, Swedish, Kazakh, Norwegian, Hindi, Telugu, Tamil, Marathi, Catalan |
No | No | No |
System Concepts Support for built-in concepts |
English, German, Spanish, French |
Portuguese(Brazilian), Italian, Chinese simplified, Chinese traditional, Indonesian, Korean, Dutch, Japanese, Arabic, Finnish, Russian, Polish, Ukrainian, Swedish, Kazakh, Norwegian, Hindi, Telugu, Tamil, Marathi, Catalan |
No | No | No |
Developer concepts Support for developer-defined concepts |
English, German, Spanish, FrenchPortuguese(Brazilian)*, Italian*, Chinese simplified*, Chinese traditional*, Indonesian*, Korean*, Dutch*, Japanese*, Arabic*, Finnish*, Russian*, Polish*, Ukrainian*, Swedish*, Kazakh*, Norwegian*, Hindi*, Telugu*, Tamil*, Marathi*, Catalan* |
– | Yes | Yes | Yes* |
Two-letter identifiers for Dates Like Mo for Monday, Tu for Tuesday, etc |
English, German, Spanish, Portuguese(Brazilian), Italian, Chinese simplified, Chinese traditional, Indonesian, Korean, Dutch, Japanese, Arabic, Finnish, Russian, Polish, Ukrainian, Swedish, Kazakh, Norwegian, Hindi |
French, Telugu, Tamil, Marathi, Catalan |
– | – | No |
* in these cases, developer concepts are not supported in entity extraction
NLP Support
Here we will list out the NLP features and their support.
NLP Feature | Supported in Languages | Not Supported in Languages | Small Talk | Traits | Knowledge Graph |
---|---|---|---|---|---|
List of Values | |||||
Full Match | All languages | – | – | – | No |
Partial Match | All languages | – | – | – | No |
Exact Match | All languages | – | – | – | No |
Ambiguity behavior | All languages | – | – | – | No |
Ambiguity with multi-item selection | English | Not supported in any language except English | – | – | No |
Spell Correction | English, German, Spanish, French, Portuguese(Brazilian), Italian, Indonesian, Korean (from ver7.3), Dutch, Arabic, Finnish, Russian Polish, Ukrainian, Swedish, Kazakh, Norwegian |
Chinese simplified, Chinese traditional, Japanese, Hindi, Telugu, Tamil, Marathi |
– | – | Yes |
Amend Entities | English | Not supported in any language except English | – | – | Yes |
Sentiment Analysis | English, German, Spanish, French, Dutch, Korean (from ver7.3), Japanese (from ver8.0), Russian (from ver8.0), Kazakh (from ver8.0), Norwegian |
Portuguese(Brazilian), Italian, Chinese simplified, Chinese traditional Indonesian, Arabic, Finnish, Polish, Ukrainian, Swedish, Hindi, Telugu, Tamil, Marathi, Catalan |
– | – | Yes |
Bot Synonyms (default) | English, German, Spanish, French |
Portuguese(Brazilian), Italian, Chinese simplified, Chinese traditional Indonesian, Korean, Dutch, Japanese, Arabic, Finnish, Russian Polish, Ukrainian, Swedish, Kazakh |
– | – | Yes |
Knowledge Graph | |||||
Patterns | All Languages | – | – | – | Yes |
Search in Answer | English, German (from ver7.3), Spanish (from ver7.3), French (from ver7.3), Portuguese(Brazilian) (from ver7.3), Italian (from ver7.3), Indonesian (from ver7.3), Dutch (from ver7.3), Finnish (from ver7.3), Polish (from ver7.3), Swedish (from ver7.3), |
Chinese simplified, Chinese traditional, Korean, Japanese, Arabic, Russian, Ukrainian, Kazakh |
– | – | Yes |
Spell Correction | English, German, Spanish, French, Portuguese(Brazilian), Italian, Indonesian, Korean, Dutch, Arabic, Finnish, Polish, Swedish, Ukrainian Russian (from ver8.0), Kazakh (from ver8.0), Japanese (from ver8.0), |
Chinese simplified, Chinese traditional, Catalan |
– | – | Yes |
Special Character support | All languages except English | English | – | – | Yes |
NL Engines | |||||
Dependency Parser Model | German (from ver7.3), French (from ver7.3), Italian (from ver8.0) |
English, Spanish, Portuguese(Brazilian), Chinese simplified, Chinese traditional Indonesian, Korean, Dutch, Japanese, Arabic, Finnish, Russian Polish, Ukrainian, Swedish, Kazakh, Norwegian, Hindi |
– | – | – |
Universal Bot Support
Here we will list out, language-wise, the trigger phrases used in training the Universal bot (see here) in the supported languages.
Phrase | Language Support | ||||||
---|---|---|---|---|---|---|---|
English | German | Spanish | French | Portuguese (Brazilian) |
Italian | Chinese Simplified |
Chinese Traditional |
Ask | Fragen | Pedir | Demander | perguntar | Chiedi | 问 | 問 |
Tell | Sagen | Contar | Dire | Contar | Raccontare | 告诉 | 告訴 |
Search | Suche | Buscar | Chercher | Procurar | Ricerca | 搜索 | 搜索 |
Open | Öffnen | Abierto | Ouvert | Aberto | Aperto | 打开 | 打開 |
Load | Belastung | Carga | Charge | Carga | Caricare | 加载 | 加載 |
Begin | Start | Empezar | Commencer | Início | Inizio | 开始 | 開始 |
Launch | Starten | Lanzamiento | lancement | Lançamento | Lanciare | 发射 | 發射 |
Talk to | Reden mit | Hablar con | Parler à | Falar com | Parlare a | 交谈 | 交談 |
Run | Lauf | correr | Courir | Corre | Correre | 跑 | 跑 |
Exit | ausgang | salida | sortie | saída | uscita | 出口 | 出口 |
Phrase | Language Support | ||||||
---|---|---|---|---|---|---|---|
English | Indonesian | Korean | Dutch | Japanese | Arabic | Finnish | Russian |
Ask | Meminta | 물어보기 | Vragen | 頼みます | يطلب | Kysyä | Спросить |
Tell | Menceritakan | 텔 | Vertellen | 伝えます | يخبار | Kertoa | сказать |
Search | Cari | 검색 | Zoeken | 探す | بحث | Hae | Поиск |
Open | Buka | 열다 | Open | 開いた | افتح | Avata | открыто |
Load | Beban | 하중 | Laden | 負荷 | حمل | Ladata | нагрузка |
Begin | Mulai | 시작 | Beginnen | ベギン | ابدأ | Alkaa | Начать |
Launch | Meluncurkan | 시작하다 | Lancering | 打ち上げ | إطلاق | Tuoda markkinoille | запуск |
Talk to | Berbicara dengan | 로 토크 | Praten met | に話す | تحدث الي | Puhua | Говорить с |
Run | Lari | 운영 | Rennen | ラン | يركض | Juosta | Запустить |
Exit | keluar | 출구 | uitgang | 出口 | خروج | poistuminen | выход |
Phrase | Language Support | |||
---|---|---|---|---|
English | Polish | Ukrainian | Swedish | Kazakh |
Ask | Zapytać | запитати | Fråga | сұрау |
Tell | Powiedzieć | сказати | Säga | Tell |
Search | Szukaj | Пошук | Sök | іздеу |
Open | otwarty | відчинено | Öppna | ашық |
Load | Załaduj | навантаження | Ladda | жүк |
Begin | Zaczynać | почати | Börja | Баста |
Launch | Uruchomić | запуск | Lansera | ұшыру |
Talk to | Mówić do | Розмовляти з | Prata med | Сөйлесу |
Run | Biegać | пробіг | Springa | жүгіру |
Exit | wyjście | вихід | utgång | шығу |