kenes регистрация номера виртуальный ассистент
Чем будет заниматься новый орган самоуправления кенес, рассказали в МНЭ
Иллюстративное фото: pixabay.com
Сегодня в ходе очередного заседания Высшего совета по экономическим реформам под председательством президента страны Касым-Жомарта Токаева министр национальной экономики Асет Иргалиев представил проект концепции развития местного самоуправления, передает NUR.KZ со ссылкой на пресс-службу министерства национальной экономики Казахстана.
Глава экономического ведомства отметил, что проект концепции разработан во исполнение поручения, озвученного главой государства в ходе послания народу от 1 сентября 2020 года «Казахстан в новой реальности: время действий».
Новая модель МСУ будет сформирована на основе пяти ключевых принципов:
Аким ЗКО рассказал о планах реализации послания президента
В рамках проводимой работы со второго полугодия 2021 года начнутся прямые выборы сельских акимов. Согласно выборному законодательству, предусмотрены два основных способа выдвижения кандидатов – от политических партий и в порядке самовыдвижения. Следующим шагом станет введение прямых выборов акимов районов с 2024 года.
Концепцией предполагается участие жителей в принятии решений по важным вопросам. К примеру, вопросы изменения статуса, наименования и границ населённых пунктов, определение приоритетных задач местного сообщества.
Наряду с этим, с 2022 года на сельский уровень будут переданы дополнительные четыре вида налогов и платежей. Это единый земельный налог, плата за пользование земельными участками, поступления от их продажи и плата за продажу права их аренды. В 2023 году будут переданы еще ряд налогов и платежей. В результате принятия мер по фискальной децентрализации, в 2025 году ожидается рост самодостаточности бюджета сельских округов до 35%.
В СКО обсудили Послание президента
Проектом концепции предусмотрены меры по эффективному использованию объектов коммунальной собственности и повышению рационального распределения расходов местного бюджета.
Так, инвентаризация и постановка на учет незарегистрированных объектов коммунальной собственности будет проводиться в упрощенном порядке. Аким сельского округа совместно с кенесом будет определять виды имущества, подлежащие передаче в коммунальную собственность местного самоуправления. Для снижения расходов на проектирование социальных объектов в селах будет разработана типовая проектно-сметная документация.
Правила использования пенсионных накоплений пересмотрят в Казахстане
Узнавайте обо всем первыми
Подпишитесь и узнавайте о свежих новостях Казахстана, фото, видео и других эксклюзивах.
Цифровые джинны: зачем компаниям виртуальные ассистенты
Люди, возможно, уже не основной вид разумных существ, населяющих нашу планету: согласно прогнозам британской консалтинговой компании Ovum, уже к 2021 году число используемых цифровых помощников превысит общее население Земли. По данным исследования Voice Report, опубликованного Microsoft в апреле 2019 года, 72% жителей таких стран, как США, Великобритания, Канада, и др., хотя бы раз пользовались помощью виртуальных ассистентов для голосового поиска в интернете, 25% они помогают делать покупки. Согласно данным Nielsen, в 24% домохозяйств США есть «умная» колонка (например, от Amazon Alexa). Цифровые помощники превращаются в своего рода джиннов — одни помогают выбрать товар, другие советуют, куда вложить деньги, третьи — заботятся о здоровье и психологическом состоянии своего хозяина.
«То, что начиналось как голубые веб-ссылки на странице с результатами поиска, сейчас трансформируется во что-то большее по масштабу и более глубокое по широте охвата, — говорится в докладе Microsoft. — Голубые ссылки исчезают. Ключевые слова исчезают. Клавиатуры исчезают. Что останется? Век кликанья по ссылкам как основного пользовательского интерфейса уступает место новой эре голоса и цифровых помощников».
Цифровые помощники берут на себя все более сложные функции — никого уже не удивить чат-ботами, консультирующими пользователей в мессенджере по несложным вопросам. Но психологи Стэнфордского университета (США) уже сейчас предлагают воспользоваться услугами цифрового помощника-психотерапевта Woebot. Его создатели рассчитывают, что на вопросы от Woebot пациенты будут отвечать более откровенно, чем на вопросы врача-человека, — с роботом можно делиться самым сокровенным. Отмечая, что уже сейчас люди пытаются обсуждать с цифровыми помощниками свои личные проблемы, эксперт британской аналитической компании TrendWatching Дэвид Маттин считает, что умные роботы со временем могут стать для человека настоящими друзьями.
Во всяком случае диалоги с ними будут составлять важную часть нашей жизни. Известный техножурналист, редактор TechCrunch Джош Констин уверен, что они полностью изменят формат потребления новостей — человек перестанет просто смотреть или слушать ведущих, а будет переговариваться с голосовым помощником, расспрашивая его о том, что произошло сегодня в мире. «Джиннов», которые помогают человеку, можно даже увидеть: американский стартап Magic Leap разработал виртуального помощника Мику. Надев очки дополненной реальности, пользователь обнаружит рядом с собой виртуальную девушку, которая выглядит почти как настоящий человек. Со временем Мика научится следить за взглядом и мимикой хозяина, определяя, что его интересует и в каком он настроении.
Полную версию материала смотрите на сайте «РБК Pro» по ссылке ниже.
Исследовательский практикум. Голосовые виртуальные ассистенты – что с ними не так?
Введение
Аналитики, исследующие сервисы чат-ботов и виртуальных ассистентов, обещают рост рынка как минимум 30% в год. В абсолютных цифрах, по состоянию на 2019 год, рынок оценивался более чем в 2 миллиарда долларов в год. Виртуальных голосовых помощников выпустили практически все ведущие мировые IT-компании, а основную работу по их популяризации уже провели Apple, Google и Amazon.
На российском рынке тоже наметились свои лидеры в этой области. Первым крупным игроком, запустивших собственного голосового ассистента в России, стал «Яндекс». По данным компании, публикуемым официально, Алисой пользуется 45 миллионов пользователей в месяц, а число ежемесячных запросов к ассистенту – составляет более 1 млрд. По мнению специалистов, 2020 год может стать для рынка голосовых ассистентов переломным – конкуренция платформ и брендов приведет к росту узнаваемости ассистентов.
В общем, то, что рынок голосовых ассистентов – интересная ниша, сомневаться не приходится. И первая идея, которая приходит в голову – взять любой из доступных сервисов ASR (Automatic Speech Recognition) и TTS (Text To Speech), связать их с конструктором ботов, имеющим поддержку NLU (Natural Language Understanding), и все! Тем более что все это довольно легко и быстро можно реализовать в облачных платформах, таких как Twilio и VoxImplant.
Проблема только в том, что полученный результат будет весьма посредственным. В чем же причина этого? Прежде всего попробуем понять почему совокупность довольно-таки неплохих технологий, собранных вместе дают такой посредственный результат. Это важно, т.к. в реальной жизни клиент всегда будет отдавать предпочтение тому сервису, чей голосовой сервис удобнее, интереснее, умнее и быстрее прочих.
Как работает типичный голосовой ассистент
Прежде всего отметим, что наша речь представляет из себя последовательность звуков. Звук в свою очередь — это наложение звуковых колебаний (волн) различных частот. Волна же, как нам известно из физики, характеризуются двумя атрибутами — амплитудой и частотой.
Речевой сигнал
Алгоритм работы ассистента:
После этого начинается процесс распознавания, и первой задачей, которую приходится решать, является разбиение всего аудио-фрагмента на отдельные слова. Речь содержит в себе некоторые паузы (промежутки тишины), которые можно считать «разделителями» слов. В итоге получается, что нам необходимо найти некоторое значение, порог — значения выше которого являются словом, ниже — тишиной. Вариантов тут может быть несколько, но это уже детали реализации, которые нам сейчас не особо интересны. Важно только понимать, что это не константа, а динамически вычисляемая величина, например, на основе анализа энтропии.
Далее происходит выделение фонем, работа с фонетическом алфавитом и в общем много чего еще, включая работу с вариантами произношения, морфологией и семантикой, причем исходя из контекста и статистики. Итогом становится то, что сервис ASR переводит набор фонем в слово.
Выделение набора слов в предложения и целые смысловые фразы, происходит аналогично делению речи на слова – по интервалам между словами. Только в этом случае величина интервала принимается большей, чем в случае деления на слова.
Возникающие проблемы
Несмотря на кажущуюся очевидную правильность реализуемого подхода, в случае голосового ассистента он несет массу проблем. Вот основные из них:
Я не просто так на первые три места поставил одну и туже проблему. Считается, что для комфортного общения ответ должен быть озвучен, примерно через 500 миллисекунд после того, как собеседник закончил формулировать свое сообщение.
Исходя из реальной практики по реализации голосовых ассистентов, в случае задержки более чем в 1 сек. голосовой ассистент довольно часто будет слышать от собеседника-человека характерные для «проверки связи» фразы: «Алло!» или «Меня слышно?». Это особенно свойственно для случаев, когда разработчики пытаются скрыть тот факт, что с человеком общается робот, особенно при исходящих телефонных обзвонах, используя вместо синтеза речи набор заранее предзаписанных аудио-файлов, сделанных реальным человеком.
Основная сложность здесь состоит в том, что в указанный интервал времени должно уместиться выполнение следующих действий:
— В каком отделении Банка вам будет удобно забрать готовую кредитную карту?
— На Ленинском проспекте. А кстати, когда оно работает? Там далеко от остановки?
— А-а-а-а… ну-у-у-у…
— Ну, как бы вам сказать, типа того как… э-э-э…
— Сейчас, одну минутку, да-а-а… Надо подумать, сразу так и не скажешь…
Что же делать?
Во-первых, при реализация голосового ассистента следует обязательно обеспечить «слушание» собеседника в т.ч. в те моменты, когда виртуальный ассистент сам озвучивает исходящее сообщение. Вариант: либо слушаем, либо отвечаем, является крайне плохой реализацией, которую следует избегать в реальной работе.
Во-вторых, следует провести оптимизацию по скорости работы всех компонентов системы. Однако, в какой-то момент времени мы обязательно упремся в пределы возможного сокращения задержек и усложнения сценариев обработки естественного языка. Поэтому, к нам приходит понимание, что требуется принципиально изменить подход к реализации голосового сервиса.
Основная идея, которая лежит в основе нового подхода, – брать пример с процесса реализуемого человеческим мозгом. Вы замечали, что человек, в процессе разговора, начинает анализировать сообщение, которое проговаривает собеседник, не в тот момент, как оно было полностью закончено, а практически сразу, в момент самого начала его звучания, уточняя с каждым новым словом? По этой причине мы, часто, готовы выдать ответ еще до того, как собеседник закончил свое сообщение.
Если вернуться к алгоритму, который должен реализовывать голосовой виртуальный ассистент, то он может выглядеть следующим образом (для иллюстрации рассмотрим входящий вопрос: «Где находится ближайший банкомат?»):
a) Запрос: «где». Результат: намерение не определено
b) Запрос: «где находится». Результат: интент «Расположение отделения» с вероятностью 50%, «Расположение банкомата» с вероятностью 50%
c) Запрос: «где находится ближайший». Результат: интент «Расположение отделения» с вероятностью 50%, «Расположение банкомата» с вероятностью 50%, сущность «Точка привязки» = «Текущее местоположение»
d) Запрос: «где находится ближайший банкомат». Результат: интент «Расположение банкомата» с вероятностью 100%, сущность «Точка привязки» = «Текущее местоположение»
Способы повысить качество работы ассистента
Давайте рассмотрим какие есть методы, что бы еще больше повысить качество работы нашего голосового виртуального ассистента:
Под этим усовершенствованием понимается возможность определять для некоторых интентов включение «перебивание» собеседника, когда содержимое выходного буфера начинает озвучиваться до того, как пользователь закончил свой рассказ. Данная настройка хорошо работает с предыдущей опцией, когда «перебивающий» ответ получает максимальный приоритет для озвучания из выходного буфера.
Очень желательно выявлять в выходном буфере ответы, которые противоречат друг-другу. В этом случае следует ответ с меньшим приоритетом просто удалять из выходного буфера.
В обычном разговоре двух и более людей, собеседники, как правило довольно точно могут определить эмоциональное состояние друг друга. Причем делается это не только по содержанию используемой лексики, например, факту наличия или отсутствия в речи ругательств, но и по тембру и скорости речи. Будет просто отлично, если ассистент сможет особым образом обслужить рассерженного пользователя.
Современные системы речевой аналитики достаточно хорошо справляются с задачей определения гендерной принадлежности и эмоционального состояния человека. Осталось только приспособить их к анализу разговора в режиме online.
Особенность реализации бизнес-кейсов
До сих пор мы рассматривали лишь технические особенности реализации виртуальных голосовых ассистентов. Но надо понимать, что не всегда успех зависит только от совершенства технической реализации. Давайте проанализируем уже рассмотренный пример: «Где находится ближайший банкомат?» и поймем, в чем есть особенность для его реализации в голосовом интерфейсе.
Знаете, есть такое правило, справедливое для менеджеров по продажам – «То, что нельзя продать по телефону, не следует продавать по телефону». По этой самой причине ответ вида «Ближайший банкомат находится по адресу …» является не информативным для человека. Если бы он хорошо знал район где сейчас находится, т.е. знал бы названия всех близлежащих улиц и номера домов, то скорее всего он и так бы знал где здесь находится ближайший банкомат. Так что такой ответ скорее всего сразу вызовет формирование другого вопроса: «А где тогда находится названный только что адрес?». Гораздо более информативным ответом будет вариант: «Ближайший банкомат находится примерно в ста метрах от вас по направлению на юго-восток», а еще лучше так же дополнительно отправить человеку сообщение типа location на Yandex или Google карты.
Универсальное правило здесь такое – если для дальнейшего использования информации требуется ее перевод в другой канал восприятия, то этот вариант является неудачным выбором для прямой реализацию в рамках голосового интерфейса. Требуется переформулировать ответ в форму, удобную для восприятия «на слух».
Для ряда сервисов, их реализация в рамках именно голосового ассистента – вообще самое удачное решение. Например, если человек находится в стрессовой ситуации, то ему как правило бывает сложно сконцентрироваться и быстро описать проблему текстом в чате, и он всегда предпочтет все высказать голосом. Это может стать важным критерием при выборе бизнес-кейсов для реализации в рамках виртуального голосового ассистента.
Второй очевидный выбор кейсов на реализацию «голосом» – необходимость их использования в ситуациях, когда есть либо законодательные ограничения на этот счет (например, находясь за рулем автомобиля запрещено вести текстовую переписку), либо просто неудобно использовать другие каналы коммуникации (например, в процессе работы или занятий спортом, когда руки человека попросту заняты).
Совершенству нет предела
Голос удобнее, чем любой другой интерфейс тогда, когда пользователю нужна очень конкретная функция для решения вполне конкретной задачи. Почему так? Очень просто – в такой ситуации необходимость ожидания загрузки сайта, скроллинг по странице, поиск по меню приложения, нажатие кнопок и т.д. всегда неудобнее, чем быстро произнесенная голосовая команда. Сайты и приложения многофункциональны. И в этом их достоинство и недостаток одновременно. Голосовой же навык должен быть заточен под функцию «здесь и сейчас».
Важно помнить, что следует избегать ситуаций, когда голосовые команды требуется сопровождать еще какими-либо дополнительными действиями в других интерфейсах. В противном случае это делает голосовой канал нерабочим т.к. нарушается принцип eyes-free, так как надо читать, и hands-free, если надо еще что-то зажимать.
Еще одна важная рекомендация – не стоит пытаться учить человека говорить. Он это и без нас умеет отлично, т.к. язык – это и так привычный и понятный интерфейс. Наглядный пример плохого стиля: «Чтобы прослушать данное сообщение еще раз, скажите: Прослушать заново». Мы ведь с вами в обычной жизни так не говорим. Разве нет? Лучше просто спросить: «Послушать сообщение ещё раз или перейти к следующему?»
Хорошим стилем реализации голосового виртуального ассистента будет вообще избегать открытых вопросов. Желательно направлять собеседника к конкретным действиям. Особенная ценность появляется там, где ассистент выступает в качестве навигатора или рекомендательной системы. Голосовой ассистент не должен требовать от человека слишком подробной информации. Уточняйте ее по ходу течения разговора.
И на конец, хотелось бы отметить, что персонализация – это, пожалуй, главное, чего не хватает существующим голосовым диалоговым интерфейсам. Без этого невозможно вести более-менее продолжительный диалог. Ассистент должен собирать данные о собеседнике, структурировать и проверять полученную информацию. Важно не терять нить диалога, сохранять и учитывать контекст разговора. Это важно. Иначе ассистент способен будет реализовать только короткие и довольно простые запросы, и, как итог, – это не позволит выйти на по настоящему живой диалог при общении голосового ассистента с пользователем.