SULARU во ВКонтакте SULARU в Facebook SULARU в Яндекс.Дзен SULARU в Blogger SULARU в GoogleNews SULARU RSS
темы

ИИ учится писать заголовки для новостей

Одна из самых непростых работ в журналистике - писать заголовки. Они теоретически должны быть содержательными и умными, привлекать читателя, но не доводить их до бешенства дешевыми трюками для поднятия кликабельности.

ИИ учится писать заголовки для новостей
фото: pixabay

Самым простым решением задачи написания заголовка, возможно, является наиболее краткое изложение статьи. Так как машины становятся все более «умными», искусственный интеллект (ИИ) уже научился писать заголовки, которые могут быть лучше тех, что придумывают журналисты и даже специалисты по названиям текстов, пишет Axios. IT-компания Primer создала свой ИИ (разработчики: Олег Васильев, Том Грек и Джон Бохэннон), который якобы может облегчить трудную задачу.

«Мы предлагаем новый метод генерации названий для неструктурированных текстовых документов. Мы реструктурировали эту проблему как задачу последовательных «вопросов-ответов». Глубокая нейронная сеть обучается на парах статья-заголовок, которые имели «распакованные» заголовки, что означает, что словарь заголовка является подмножеством словарного запаса документа. Для обучения ИИ мы использовали множество из миллионов публично доступных пар новость-заголовок: новостные статьи и заголовки. Мы представляем результаты рандомизированного двойного слепого исследования, в котором респонденты не знали, какие названия были созданы человеком или ИИ. После обучения на примерно 1,5 млн новостных статей, ИИ генерирует заголовки, которые респонденты посчитали в большинстве случаев такими же или лучше, чем делали люди», - утверждают авторы нового алгоритма.

Другими, словами, чтобы узнать, как редакторы пишут заголовки, система обучалась только на парах статья-заголовок, где название сообщения полностью состояло из слов, содержащихся в тексте. После обучения ИИ смог анализировать текст новой статьи, чтобы создать «машинный» заголовок. В своеобразном Тесте Тьюринга, которому авторы алгоритма подвергли случайных людей, ИИ показал якобы отличные результаты, превзойдя редакторов в более чем половине случаев.

Пожалуй, стоит заметить, что понимание и генерирования литературного или разговорного языка по-прежнему является одной из самых трудных проблем для ИИ. Однако машины, судя по всему, делают большие успехи в этой области. Разработчики Primer экспериментируют не только с заголовками. Они пробуют писать тексты новостных сообщений. Тексты смотрятся достаточно реалистично - как хорошая проза, но в них нет достаточно фактов и контекста, что характерно для журналистики.

Axios попросило научного директора Primer сделать заголовки для некоторых недавних статей издания.

Заголовок Axios: Раскрытие секретного правительственного ИИ (Uncovering secret government AI)
Заголовок Primer: ИИ и разведка
Впечатление: Слишком общее название

Заголовок Axios: Война за приобретение ИИ (The AI acquisitions war)
Заголовок Primer: ИИ-компании с 2010 г., создание нового фронта в безостановочной войне
Впечатление: нет, вообще не о том

Заголовок Axios: Издольщики от ИИ (The AI sharecroppers)
Заголовок Primer: Новые "издольщики"
Впечатление: Нас превзошли!

Заголовок для статьи другого издания: Отчаянный поиск массовых захоронений в Ливане (The desperate search for Lebanon's mass graves)
Заголовок Primer: Пропавшие воспоминания о Бейруте
Впечатление: Очень хорошо

Что дальше можно ожидать от Primer? Обобщение огромных объемов текстов может помочь выловить полезную информацию в бездонном море неструктурированных данных. В конечном итоге, утверждает Бохэннон, машина, которая имеет хорошее представление о ваших предпочтениях, может проанализировать миллионы документов и отправить вам справку с наиболее актуальной информацией.

Заключение

Логика машинного обучения, пожалуй, очень напоминает логику обучения людей скорочтению. В быстром чтении нет секрета от слова «совсем». Оно базируется всего на трёх китах: избавлении от проговаривания внутреннего текста, возникшего из-за обучения чтению по слогам, расширении привычного поля зрения и закреплении навыка отсекать избыточность текста.

Вот последнему и пробуют научить машину, так как первые два аспекта для неё не представляют проблемы. Однако при скорочтении человек всегда задействует ассоциативные цепочки мышления. Машина решает эту проблему через программный код и вычислительные мощности. Но насколько точно она сможет когда-нибудь воспроизвести ваше представление о тексте, покажет время.

Конечно, мы значительно упростили объяснение, как работает машинное обучение (там не отсекается ничего лишнего). Но это сделано умышленно, по причине очень объемной и специфичной тематики: нейронные сети - это сложно, но за ними - будущее.

Facebook В Контакте Twitter Одноклассники WhatsApp Viber Telegram E-Mail

Новые события в экономике

темы
SCMP: Китайские ученые подтвердили «невероятный прорыв» в стелс-технологиях

SCMP: Китайские ученые подтвердили «невероятный прорыв» в стелс-технологиях

Исследователи из Академии наук Китая считают, что моделирование электромагнитных волн является ключом к новой эре в радиолокационном обнаружении военных кораблей и самолетов. Созданная на основе математической модели профессора Луо Сяньгана "метаповерхность" обещает невиданную до сих пор эффективность радиолокационной невидимости. Конечно, если китайцы не преувеличивают.

новости
Минтруд РФ прогнозирует рост числа безработных на 60% за счет предпенсионеров

Минтруд РФ прогнозирует рост числа безработных на 60% за счет предпенсионеров

В 2020 году показатель среднемесячной численности безработных в России вырастет в 1,6 раза, так как граждане предпенсионного возраста могут начать массово регистрироваться в качестве безработных.

темы
CNBC: F-35 перепугал Иран и перемешал все карты на Ближнем Востоке

CNBC: F-35 перепугал Иран и перемешал все карты на Ближнем Востоке

Американское издание пробует сделать политико-экономическую оценку появления на вооружении США и их союзников единого ударного истребителя пятого поколения. Производство F-35 стало самым дорогим оборонным проектом в истории Америки. CNBC аргументирует, почему этот проект не заслуживает той критики, которой его подвергли.

темы
Адам Смит - современный почти до безобразия. Часть II

Адам Смит - современный почти до безобразия. Часть II

Четверть века назад издание «Дело» напечатало шедевр Марка Блауга - 4-е издание книги «Экономическая мысль в ретроспективе». За 25 лет утекло много воды. Последовав примеру Блауга, который серьёзно переписывал книгу каждые 10 лет, мы будем её редактировать под потребности нашего времени.

новости
Медианная зарплата работников крупных и средних предприятий составляет 34 335 рублей

Медианная зарплата работников крупных и средних предприятий составляет 34 335 рублей

Если бы Росстат учитывал в исследовании малые предприятия, то цифра медианного значения оплаты труда была бы ещё ниже. Медианная зарплата значительно ниже средней зарплаты по России, то есть 47 657 рублей.