30.05.2023
Нечаянно или специально, но в конце 2022 года компания OpenAI полностью открыла ящик Пандоры, запустив в массы искусственный интеллект под названием ChatGPT. Буквально за пару месяцев ChatGPT стал одним из самых популярных приложений с аудиторией в 100 млн пользователей. Спустя несколько месяцев гигант Google запустил своего ИИ помощника под названием Bard на языковой модели PaLM 2. На сегодняшний день новые ИИ сервисы на базе языковой модели GPT появляются на рынке чуть ли не каждый день. В этом материалы мы собрали 10 полезных и умных помощников для генерации PDF-презентаций, озвучки видеороликов, деловой корреспонденции, написания текстов, создания изображений для брендов и прочих рутинных задач.
В отличие от большинства сервисов, которые скорее использовали простые алгоритмы и называли это ИИ, ChatGPT (https://chat.openai.com) и Google Bard (https://bard.google.com) получились действительно умными. Обе модели обучили на громадных объемах текста, который в миллион раз превышает объем всех сочинений Шекспира, что существенно расширило сферу знаний, а сами ИИ понимают контекст разговора и могут вести осмысленный диалог. Что еще круче, помощник может помогать с оформлением документов и презентаций, переводить тексты с других языков, проверять код на ошибки, помогать с составлением юридических запросов, читать вместо вас тексты, делая для вас краткие саммари написанного и еще много чего. То есть это далеко не те примитивные алгоритмы машинного обучения, которые натаскали на выполнение какой-то единственной задачи и назвали это ИИ, чтобы выбить больше денег из инвесторов.
Стартовая страница для диалога с ChatGPT. |
В данном материале мы поговорим о ChatGPT и Google Bard в контексте поиска информации. Оба сервиса работают в схожем ключе ― это просто строка чата, в которую можно написать «привет как дела?», узнать результаты полуфиналов Лиги Чемпионов или получить краткую выжимку лекции по термодинамики. Что особенно важно, ИИ-бот лучше понимает суть запроса и помнит контекст разговора. То есть можно создать несколько разных чатов, посвященных разным темам (например, медицине и юриспруденции) и общаться с ботом даже посредством сложных наводящих вопросов, которые поставят в тупик обычный поисковик Google. К примеру, на вопрос «возможно ли свержение авторитарного режима без применения силы» Google выдаст ссылку на вики-статью об авторитаризиме и какие-то ссылки на посты в соцсетях, которые частично соответствуют запросу. ChatGPT и Bard быстро проведут небольшое историческое исследование и выдадут небольшую выжимку фактов, которые потом можно с ним же и обсудить.
И необязательно все усложнять, оба ИИ могут помочь советами как выбрать городской велосипед https://ek.ua/list/161/pr-9366/, вкусно пожарить картошку, вспомнить величайших немецких композиторов и т.д. При этом он ничего не придумывает сам, а фактически собирает доступную в сети информацию и компилирует ее в понятном формате. Информация обычно выдается обобщенной, но в большинстве случаев это намного удобнее обычного запроса в Google, который на первой странице показывает кучу рекламы и ссылки на малополезные СЕО-статьи. Единственный минус, что публичная версия ChatGPT пока что использует языковую модель третьего поколения, натренированную в 2021 году, поэтому события 2022 и 2023 года для него окутаны туманом, о чем он сам честно сообщит. Но это лишь вопрос времени, пока не вышел ChatGPT4. Второй нюанс связан с самой природой запросов ― обычно, чтобы получить ответ на сложный вопрос, скорее всего, понадобятся дополнительные уточняющие запросы, которые еще и нужно грамотно составить. Третий минус ― в интернете могут написать неправду, а ИИ, как и обычный человек может ее подхватить и ввести в заблуждение. Поэтому критическое мышление и дополнительные проверки, увы, не отменяются.
Google Duet AI (https://cloud.google.com/blog/products/application-modernization/introducing-duet-ai-for-google-cloud) ― это комплекс умных помощников для всех приложений Google, объединенных в пакете Workspace. Их можно использовать для генерации идей для статей, автоматического создания текстов в Google Docs, оформлении писем в Gmail, генерации изображений для презентаций в Slides и т.д. Особенный акцент разработчики делают именно на помощь в написании писем со смартфона ― по мнению Google, ИИ сможет здорово упростить и автоматизировать этот не самый удобный для смартфона процесс, помогая написать сам текст или придумать план письма. Также крайне удобной выглядит функция создания автоматической стенограммы во время переговоров или мозговых штурмов. ИИ может записывать речь, конвертировать ее в текст, делать выжимки самого важного и затем отправлять их всем участникам встречи.
Для взаимодействия с помощником был разработан новый интерфейс Sidekick — отдельная боковая панель, на которую выводится результат ИИ-анализа просматриваемых пользователем документов, подсказки в работе, напоминания из органайзера и т.д. В комментариях под трансляцией с конференции Google I/O несколько раз отмечали, что так могла бы выглядеть первая версия ИИ Джарвиса из Железного Человека, который помогал Тони Старку с рутинными задачами. Сразу нужно отметить, что на момент публикации этого материала большинство функций ИИ в Workspace пока находятся в стадии бета-тестирования. Подать заявку на участие можно по ссылке в шапке.
Perplexity (https://www.perplexity.ai/) является частью растущей волны стартапов, стремящихся использовать искусственный интеллект, чтобы ослабить контроль Google над онлайн-поиском. Среди его инвесторов большое количество исследователей искусственного интеллекта, включая нынешних и бывших руководителей из Google и Microsoft. В отличие от ChatGPT и Google Bard, которые умеют все понемногу, Perplexity заточен именно под поиск информации. На условный запрос «какого роста был Иисус» ChatGPT и Bard выдадут что-то на эту тему нет точных данных, историки спорят, всей правды мы не узнаем. Perplexity попытается копнуть глубже, выдаст несколько теорий, что Иисус был нормального роста или наоборот коротышкой, затем выдаст несколько источников, из которых он почерпнул эту информацию и закончит все несколькими похожими запросами от других пользователей. Такой формат особенно удобен для академической работы.
Gamma (https://gamma.app/) — веб-приложение, способное создавать презентации за секунды. С его помощью вы можете легко генерировать документы, презентации и веб-страницы, используя мощный ИИ-генератор, который затем позволяет вам дорабатывать и настраивать полученный результат. Этот сервис подходит как для новичков, так и для опытных пользователей, предлагая удобные инструменты для создания ярких и эффективных проектов, включая текст, изображения. Нужно отметить чрезвычайно удобную организацию сервиса, особенно дружелюбную к казуальным пользователям, которые не имеют особого опыта с графическими редакторами и ПО для создания презентаций. Для начала Gamma предлагает выбрать формат (документ, презентация, веб-страница) и общую тему ― например, рекламу нового барбершопа или турпоездок в Бурятию.
Затем он предложит план документа и один из многочисленных визуальных стилей. После этого ИИ на ваших глазах начинает работу: сначала придумывает название и слоган для барбершопа, делает слайды «о нас» и «об услугах» с тематическими фотографиями, текстами и взятыми наобум ценами. Затем на наших глазах появляются слайды с представлением несуществующей команды парикмахеров и менеджеров, слайды с геолокацией и графиком работы, а также последняя страничка со ссылками на несуществующие профили в соцсетях и Gmail. Естественно, вместо этих холдеров нужно вписать актуальную информацию, после чего можно поиграться со шрифтами и финальным визуальным оформлением. Сервис оформлен как обычный PDF-редактор, редактировать все можно налету с помощью веб-интерфейса, а весь процесс обычно не занимает более 15 минут.
Lovo (https://lovo.ai/) ― это крайне интересный и полезный сервис для создателей видеороликов, позволяющий натурально озвучить написанный текст без профессионального диктора, качественного микрофона и звуковика, который почистит запись от шипящих, уберет лишний бас и скомпрессирует звук, чтобы все звучало красиво и профессионально. Мы видели десятки разных преобразователей текста в речь и большинство из них звучат именно так, как и должен звучать робот. В отличие от них Lovo работает на совершенно ином уровне, позволяя пользователю выбрать один из множества доступных голосов, выбрать подходящий для ролика эмоциональный окрас, и с помощью встроенного аналога автотюна поправить отдельные слова или буквы, чтобы речь звучала более натурально. В общем, тот случай, когда лучше услышать самому.
Популярной альтернативой Lovo является другой генератор речи Murf (https://murf.ai/).
Интересный сервис для учащихся и не только, который позволяет работать с конкретным PDF документом, будь то нонфикшн книга по нейробиологии, научная статья по квантовой физике или свод юридических законов. Теоретически это может делать и ChatGPT, которому также можно скормить любой текст, однако Chat PDF (https://www.chatpdf.com/) будет всегда отвечать именно в контексте этого документа, в то время как ChatGPT или Bard со временем могут начать путаться в ответах и забывать, с чего начался разговор. Другой важный плюс сервиса заключается в том, что в Chat PDF можно загрузить документ на любом языке, но общаться бот будет на удобном вам языке. То есть это фактически смесь умного академического поиска и переводчика.
Eightify может посмотреть вместо вас ролик с YouTube, а затем пересказать самую важную и полезную информацию. |
Сервис Eightify (https://eightify.app/) во многом напоминает упоминавшийся выше Chat PDF, с той разницей, что он работает не c PDF документами, а с видеороликами. К примеру, ему можно скормить ролики Тимоти Снайдера по истории Украины, цикл лекций Ричарда Фейнмана по физике или подкаст про ухаживание за котами и моментально получить краткую выжимку о чем сам ролик, что там важного говорили и какие выводы из этого можно сделать. По сути это бесплатный автоматизированный аналог сервисов а-ля Retell и Instaread, только для видеороликов, а не книг. В общем, еще один крайне полезный инструмент для учащихся, который к тому же работает в формате удобного расширения для браузера.
Сервисы Dall-E и Midjourney взорвали сеть еще до выхода ChatGPT, позволяя генерировать реалистичные изображения, картины и фотографии в самых разных стилях. В отличие от них сервис Stockimg.ai скорее создан для нужд предпринимателей, небольших стартапов и создателей цифрового контента. В частности он заточен под генерацию постеров, обложек книг, логотипов, лендингов, иллюстраций, стоковых фотографий и многого другого. Stockimg (https://stockimg.ai/) оснащен фильтрами для более точной генерации, позволяя задать стиль изображения или какие-то ограничения вроде использования агрессивного красного цвета при создании логотипа для условного благотворительного фонда или ветеринарной клиники.
Для начала сервис предложит выбрать необходимый вам формат ― постер, обложку, открытку, логотип и т. д. Дальше появится окно редактора и генератора, в котором пользователю нужно ввести запрос для генерации изображения как в Dall-E или Midjourney. Например, «лягушка едет верхом на собаке», «Доналд Трамп танцует гопак» или что-то посложнее в духе «деревянная гостиная, большой разожженный камин, елка, реалистичное освещение, кинематографичный рендер в 4K». После этого нужно выбрать наиболее подходящую для запроса модель генератора (disco diffusiuon, analog diffusion, real photo и т. д.), выставить финальные требования для изображения и можно запускать генератор. Когда найдете что-то по душе, это изображение можно отредактировать и загрузить с сервера.
Gyre (https://gyre.ai/docs/install/gyre-installer) ― это бесплатное приложение для редактирования изображений с открытым исходным кодом, которое способно применять силу ИИ для комплексной обработки фотографий. Благодаря использованию базы Stable Diffusion и других обучающих моделей возможности сервиса в некоторых аспектах даже превосходят великий и ужасный Фотошоп. Прелесть Gyre заключается в том, что редактирование происходит с помощью текстовых запросов, поэтому юзеру не нужно обладать опытом обработки фотографий и знанием инструментов фоторедактора. С помощью обычного запроса Gyro может убрать бывшую девушку с общей фотографии, стереть задний фон и заменить его на новый, дорисовать настенный ковер на семейной фотографии и даже полностью изменить стиль изображения, оставив не тронутыми ключевые объекты и т.д. В общем, штука весьма впечатляющая. Минус, что придется немного повозиться с установкой так как у сервиса нет привычного инсталлятора, веб-версии и мобильных приложений.
Возможно вы удивитесь, но с развитием ИИ появилась и новая сфера деятельности ― эдакий оператор ИИ (https://www.promptbox.ai/), который умеет составлять грамотные запросы для ИИ, сводящие к минимуму ненужную информацию. Это особенно полезно при выполнении каких-то нетривиальных задач вроде генерации текста на специфическую тему в определенном литературном стиле или генерация черно-белого изображения кота Степана в стиле раннего Босха. Некоторые юзеры настолько превознеслись в своем умении составлять запросы, что даже начали их продавать, а сами себя стали называть AI Artist. Если у вас нет желания самому копаться в этой теме или кому-то платить, то в сети уже есть специальный сервис с базой самых разных комплексных запросов-алгоритмов для ChatGPT, Stable Diffusion, Dall-e и десятков других ИИ-сервисов.
Потенциал работы ИИ в автоматизации бизнес-процессов безграничен, и его стоит использовать в рабочих процессах уже сейчас. А какие вы знаете сервисы с использованием искусственного интеллекта и как они вам помогают?