Загрузил d1ma-balak

Признаки сгенерированного ИИ текста

Википедия:Признаки сгенерированности
текста
Материал из Википедии — свободной энциклопедии
Эта страница — эссе о Википедии
Эссе поясняет некоторые особенности работы Википедии (или мнение
части участников об этих особенностях). Эссе не является правилом или
руководством; несмотря на это, некоторые эссе могут отражать
широкораспространённые нормы. Вы можете обсудить эту страницу или
обновить (https://ru.wikipedia.org/w/index.php?title=%D0%92%D0%B8%D
0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%9F%D
1%80%D0%B8%D0%B7%D0%BD%D0%B0%D0%BA%D0%B8_%D1%81%D
0%B3%D0%B5%D0%BD%D0%B5%D1%80%D0%B8%D1%80%D0%BE%D
0%B2%D0%B0%D0%BD%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%D
1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0&action=edit) её.
ВП:ПРГЕН
Вкратце: У искусственного интеллекта есть свои особенности в
формулировках, которые опытные участники Википедии легко заметят. ИИ не
всегда знает все правила проекта, особенно про авторитетные источники,
поэтому всегда проверяйте информацию самостоятельно.
В этом эссе собраны основные признаки текстов, написанных
чат-ботами вроде ChatGPT. Оно поможет находить в Википедии
материалы, созданные с помощью ИИ. Список основан на
наблюдениях, а не на строгих правилах. Официальные
рекомендации по оформлению статей можно найти в правилах и
Руководстве по оформлению статей.
Этот список не запрещает определённые слова, фразы или знаки
препинания. Не весь текст, содержащий эти признаки,
сгенерирован ИИ, поскольку большие языковые модели (БЯМ),
на которых работают чат-боты с ИИ, обучаются на человеческом
тексте, в том числе и из Википедии. Это некий каталог очень
распространённых
закономерностей,
наблюдаемых
во
множестве примеров текста, сгенерированного ИИ конкретно
для Википедии.
Даже если текст, созданный ИИ, проверен человеком и написан
Пример галлюцинации нейросетевой
без существенных ошибок, могут оставаться скрытые проблемы,
модели «YandexGPT» с описанием
например, подлог источников. Ссылки на известные издания
несуществующего праздника
(The Verge, The New York Times, The Guardian), книги или
официальные документы могут казаться правдоподобными, но
при проверке оказывается, что нужной информации на странице нет или сама страница не существует
(ошибка 404).
Следует придерживаться советов из эссе Большие языковые модели. В сообществе допустимо
использование ИИ для проверки грамматики, пунктуации и орфографии, но полностью доверять
создание статьи боту ошибочно и почти всегда обречено на провал (удаление по критерию C7).
Не стоит полностью доверять «детекторам ИИ» (например, GPTZero или GigaCheck) при определении,
написан ли текст с помощью нейросети. Да, иногда они справляются лучше человека, но в основе
таких инструментов лежит тот же искусственный интеллект, который фактически проверяет сам себя.
У них высокий уровень ошибок, поэтому окончательное решение всегда должно оставаться за
человеком.
Содержание
Обсуждения использования ИИ
Введение
Чрезмерный акцент на символизме и важности
Пример
Чрезмерный акцент на известности и освещении в СМИ
Примеры
Примеры
Поверхностный анализ
Примеры
Рекламный и перегруженный позитивизмами язык
Примеры
Дидактические и редакционные оговорки
Примеры
Отдельный раздел/подраздел для краткого содержания написанного
Примеры
Выводы о проблемах и перспективах на будущее
Примеры
Отношение к названиям статей в Википедии как к определениям или именам собственным
Примеры
Сноски
Неработающие внешние ссылки
Несуществующие контрольные суммы ISBN и DOI
Примеры
UTM–метки
Примеры
Имитация диалога
Примеры
Отказ от ответственности и отсутствие источников
В обсуждениях
Примеры
Речевые обороты
Параллелизмы с уточнениями
Примеры
«Правило трёх»
Примеры
Обтекаемые формулировки
Примеры
Избегания частого повторения слов (тавтологии)
Пример
Крайности
Примеры
Разметка
Использование Markdown
Примеры
Несуществующие категории
Стиль
Заглавная буква
Примеры
Чрезмерное использование жирного шрифта
Пример
Вертикальные списки с заголовками
Пример
Злоупотребление длинными тире
Примеры
См. также
Обсуждения использования ИИ
Введение
Искусственный интеллект строит ответы на основе статистики: он анализирует
ВП:СНИИ
большой массив текстов и выбирает наиболее вероятные, «средние» формулировки.
Например, если десять источников пишут об одном и том же человеке примерно
одинаково, а два приводят уникальные факты, ИИ, скорее всего, использует общую информацию и
проигнорирует редкие детали, разбавив текст шаблонными фразами. Это одна из подсказок, что текст
мог быть сгенерирован нейросетью.
ИИ обучается на данных из интернета, где известные личности обычно описываются в
положительном ключе. Поэтому нейросети часто упускают конкретные, редкие или необычные факты
и заменяют их общими, слишком восторженными формулировками. Например, вместо точного факта
«изобрёл первое сцепное устройство для поездов» ИИ может написать «стал революционным
титаном промышленности». Так текст теряет конкретность и становится слишком обобщённым.
Такое сглаживание конкретных фактов в универсальные, шаблонные утверждения на любые темы (от
футбола до антропологии) помогает распознать текст, написанный искусственным интеллектом.
Чрезмерный акцент на символизме и важности
Слова-маркеры: выступает/служит/является напоминанием/, играет
важную/значительную/ключевую роль, подчёркивает/выделяет его
важность, символизирует его устойчивое/длительное влияние,
ключевой/поворотный момент, неизгладимый след, непоколебимо
преданный своему делу ...
Искусственный интеллект часто преувеличивает значение даже самых обычных вещей. Это легко
заметить по характерным формулировкам, например: «Хотя он малоизвестен, он символизирует...»
или «Хотя это незначительный факт, он способствует/выступает/символизирует...».
Когда искусственный интеллект пишет о биологии, он слишком подробно описывает статус
сохранности и меры по защите, даже если на самом деле этот статус не определён и никаких
серьёзных усилий по сохранению не ведётся. Кроме того, ИИ может пытаться найти глубокий смысл
или символику там, где её нет, например, в научной классификации вида (таксономии).
Пример
Берри Хилл сегодня выступает символом устойчивости сообщества,
экологического обновления и исторической преемственности. Превращение
центра угледобычи в процветающую зелёную зону отражает развивающуюся
идентичность Сток-он-Трента.
— Из Википедии на английском языке Draft:Berry Hill, Stoke-on-Trent
Охотясь на вредителей, вид жуков Zagloba играет значительную роль в
естественной борьбе с вредителями, содействуя экологическому равновесию и
развитию сельского хозяйства
— Из этой версии статьи Zagloba (beetle)
Чрезмерный акцент на известности и освещении в СМИ
Слова-маркеры: незавимое освещение, в местных/региональных/
государственных [название страны] СМИ, музыкальные/деловые/
технологические издания
Искусственный интеллект часто пытается убедить читателя в значимости предмета, просто
перечисляя источники, где тот хоть как-то упоминается, без анализа, что именно там сказано. При
этом ИИ может искажать информацию: преувеличивать её важность или, реже, преуменьшать,
выдавая за мнение источника собственные поверхностные выводы.
ИИ, в отличие от человека, при написании статей для Википедии часто буквально цитирует её
правила (например, «независимое освещение событий»/«о [предмет статьи] писали такие-то
новостные издания»), ломясь в открытую дверь (т. е. пытаясь доказать очевидное).
Примеры
Её достижения и выступления освещались в нескольких филиппинских СМИ ,
включая Manila Standard, Philstar.com, Asian Journal и LionhearTV.
— Из Draft:Joice Espinoza
Он освещался в нескольких национальных СМИ , включая Forbes, Barron’s,
Fortune и Bloomberg за его вклад в финтех-индустрию, а также за то, что он
представлен в списке Crain's Chicago Business's "40 до 40" в 2022.
— Из Draft:Brian Barnes (entrepreneur)
В частности, в Википедии ИИ часто старательно подчеркивает приведённые источники в основном
тексте — даже при освещении тривиальных вопросов, неоспоримых фактов или в других ситуациях,
когда редактор Википедии скорее всего вообще не укажет источник.
Примеры
В декарбе 2022 года The Telegraph упомянуло «Alternative Airlines» как самую
дешёвую авиакомпанию для перелётов.
— Тривиальное утверждение, не требующее источника прямо в тексте. Из
Draft:Alternative Airlines
Согласно документам из «Companies House», годовая выручка составила £75.2
миллионов в 2023 и £83 миллиона в 2024.
— Указание источника для неопровержимой информации из Draft:Alternative
Airlines
Поверхностный анализ
Слова-маркеры: обеспечивает ..., выделяет ..., подчёркивает ...,
отражает ..., влияет ..., демонстрирует ..., соответствует
..., содействует ...
ВП:ПАИИ
Чат-боты с искусственным интеллектом склонны использовать поверхностный анализ информации,
часто с точки зрения её значимости, узнаваемости или воздействия.
Одни только эти слова могут насторожить, но есть сигнал ещё более явный, когда в тексте действия
приписываются не людям, а фактам или событиям. Например, человек может «подчеркнуть»
важность чего-либо, но сам факт или событие не может ничего «выделять»/«подчёркивать», так как
это неодушевлённый предмет.
Примеры
Дуэра находится в непосредственной близости от столицы Алжира, еще больше
усиливая его значение как динамичного центра деятельности и культуры.
— Из этой версии статьи Douéra
Эти слова появляются в признанных научных изданиях уже более шести
десятилетий, демонстрируя длительное влияние Блуа на компьютерный код,
грамматику и неологию.
— Из этой версии статьи Draft:Jacques Blois (linguist)
В 2025 году Федерация получила международное признание и приглашение
принять участие в Азиатском саммите по пиклболу, подчеркивая вхождение
Пакистана в мировое сообщество любителей пиклбола.
— Из этой версии статьи Draft:Pakistan Pickleball Federation
Рекламный и перегруженный позитивизмами язык
Слова-маркеры: богатый, яркий, разнообразный,
имеет художественное/культурное/
литературное/медийное значение, может
похвастаться/продолжает очаровывать,
потрясающая природная красота, вековое
наследие, расположенный в самом сердце ...
ВП:НАПИИ
ВП:НапыщенностьИИ
У искусственного интеллекта серьёзные проблемы с сохранением нейтрального тона, особенно когда
он пишет о чём-то, что можно считать «культурным наследием» — в этом случае он постоянно
напоминает читателю об этом. Он также часто использует позитивно звучащую лексику , например,
«богатый культурным наследием город», призывая убедить читателя в ценности или важности
предмета.
Примеры
Аламата-Рая-Кобо, расположенный в захватывающем дух регионе Гондэр в
Эфиопии, – это динамичный город с богатым культурным наследием,
занимающий важное место в регионе Амхара. Живописные пейзажи и
исторические достопримечательности Аламата-Рая-Кобо открывают перед
посетителями захватывающий взгляд на многообразие Эфиопии. В этой статье мы
рассмотрим уникальные особенности Аламата-Рая-Кобо, которые делают его
городом, достойным посещения, и расскажем о его значимости для региона
Амхара.
— Из этой версии статьи Alamata (woreda)
Дидактические и редакционные оговорки
Слова-маркеры: важно/критично/необходимо отметить, "стоит учесть/
запомнить/отметить", значения могут варьироваться...
LLM часто рассказывают читателю о вещах, которые «важно помнить». Таким образом ИИ снимает с
себя ответственность перед воображаемым читателем относительно безопасности или спорных тем,
или устранения неоднозначности в вопросах, которые различаются в разных регионах/юрисдикциях.
Примеры
Появление этих неформальных групп отражает растущее понимание
взаимосвязанности городских проблем и потенциала АНК в формировании
городской политики. Однако важно отметить, что эти фракции действуют вне
официальной структуры АНК, и их влияние на политические решения может быть
различным.
Крайне важно отличать независимую исследовательскую компанию в области
искусственного интеллекта, базирующуюся в Ереване (Армения), которая является
предметом настоящего отчета, от этих не связанных между собой организаций,
чтобы избежать путаницы..
— Из этой версии статьи Draft:Robi Labs
Отдельный раздел/подраздел для краткого содержания написанного
Слова-маркеры: В кратце, В заключение, В целом ...
ВП:Заключение
При создании длинных текстов (например, когда ему говорят «написать
ВП:Вывод
статью»), ИИ часто добавляет раздел под названием «Заключение» или чтото подобное и заканчивают абзац или раздел, суммируя и переформулируя его основную идею.
Примеры
Подводя итог, можно сказать, что образовательная и профессиональная
траектория медсестёр-ученых обычно включает в себя переход от степени
магистра сестринского дела к степени доктора философии в области сестринского
дела, а затем постдокторскую подготовку в области исследований в этой области.
Этот структурированный путь гарантирует, что медсёстры-ученые приобретут
необходимые знания и навыки для проведения глубоких исследований и внесения
значимого вклада в развитие сестринского дела.
— Из этой версии статьи Nurse scientist
Выводы о проблемах и перспективах на будущее
Слова-маркеры: Несмотря на ..., Сталкиваются с рядом проблем,
Несмотря на эти проблемы, Перспективы на будущее ...
Статьи, созданные LLM, часто включают раздел «Проблемы» (например, об экологических
последствиях после какого-то события), который обычно начинается с предложения вроде:
«Несмотря на [положительные/рекламные слова], [тема статьи] сталкивается с трудностями...» и
заканчивается либо неопределённо положительной оценкой темы статьи, либо размышлениями о
том, как текущие или потенциальные инициативы могут принести пользу в решении проблемы,
обозреваемой в статье. Такие абзацы обычно размещаются в конце статей с определенной структурой,
которые также могут включать отдельный раздел «Перспективы на будущее».
Примеры
Несмотря на процветание промышленности и жилой застройки, Кораттур
сталкивается с проблемами, типичными для городских территорий, в том числе
[...] . Благодаря своему стратегическому расположению и постоянным
инициативам, Корратур продолжает процветать, как неотъемлемая часть
промышленной зоны Амбаттур, воплощая синергию промышленности и жилой
жизни.
— Из этой версии статьи Korattur
Несмотря на успех, Панамский канал сталкивается с трудностями, включая [...]
Современные инвестиции в технологии, такие как автоматизированные
навигационные системы, и потенциальное дальнейшее расширение могут
повысить эффективность канала в будущем, сохранив его значимость в мировой
торговле
— Из этой версии статьи Panama Canal
Отношение к названиям статей в Википедии как к определениям или именам
собственным
В сгенерированных чат-ботами статьях ИИ определяет заголовок какой-либо статьи в виде отдельной
сущности или термина, что заметно почти сразу и выглядит неестественно.
Примеры
«Влияние тревожности на обучение при изучении иностранного языка» относится
к чувствам напряжения, нервозности и опасения, испытываемым при изучении
или использовании языка, не являющегося родным.
— Из этой версии статьи Draft:The Effects of Foreign Language Anxiety on Learning
«Список песен о Мексике» — это тщательно подобранные музыкальные
композиции, где упоминается культура, география или идентичность Мексики в
качестве главной темы.
— Из этой версии статьи List of songs about Mexico
Сноски
Неработающие внешние ссылки
ВП:ИИРЕФ
Если в новой статье есть несколько ссылок, которые ведут в никуда (например, выдают ошибку 404), и
этих ссылок нет в веб-архивах (Wayback Machine, Archive Today) это почти наверняка говорит о том,
что текст создан ИИ. Ссылки со временем становятся неработоспособными, но в только что
написанном тексте такого быть не должно.
Несуществующие контрольные суммы ISBN и DOI
Контрольная сумма может использоваться для проверки ISBN. Неверная контрольная сумма — весьма
вероятный признак подложного ISBN или идентификатора DOI, и в этом случае шаблон
«примечания» выводит предупреждение. Википедия имеет собственный поиск по ISBN при нажатии
на него в соответствующем разделе (литература, примечания, комментарии) какой либо статьи.
Полное отсутствие выдачи почти всегда показывает подлог. Ниже пример генерации ChatGPT.
Примеры
Закон Ома — фундаментальный принцип в области электротехники и физики,
гласящий, что ток, проходящий через проводник между двумя точками, прямо
пропорционален напряжению в этих двух точках при условии, что температура остаётся
постоянной. Математически это выражается как V = IR, где V — напряжение, I — сила
тока, а R — сопротивление. Закон был сформулирован немецким физиком Георгом
Симоном Омом в 1827 году и служит краеугольным камнем в анализе и проектировании
электрических цепей [1]. Закон Ома применим ко многим материалам и компонентам,
которые являются «омическими», то есть их сопротивление остаётся постоянным
независимо от приложенного напряжения или тока. Однако он не применим к
нелинейным устройствам, таким как диоды или транзисторы [2][3].
Примечания
1. Dorf, R. C., & Svoboda, J. A. (2010). Introduction to Electric Circuits (8th ed.). Hoboken, NJ:
John Wiley & Sons. ISBN 9780470521571.
2. M. E. Van Valkenburg, “The validity and limitations of Ohm’s law in non-linear circuits,”
Proceedings of the IEEE, vol. 62, no. 6, pp. 769–770, Jun. 1974. doi:10.1109/PROC.1974.9547
(https://dx.doi.org/10.1109%2FPROC.1974.9547)
3. C. L. Fortescue, “Ohm’s Law in alternating current circuits,” Proceedings of the IEEE, vol.
55, no. 11, pp. 1934–1936, Nov. 1967. doi:10.1109/PROC.1967.6033 (https://dx.doi.org/10.110
9%2FPROC.1967.6033)
Ссылки на книги кажутся достоверными – в книге по электрическим цепям (первая сноска), вероятно,
есть информация о законе Ома, – но без номера страницы эта книга бесполезна для проверки
утверждений, содержащихся в тексте. Хуже того, обе ссылки в Трудах IEEE полностью вымышлены, а
DOI приводят к совершенно другим публикациям. Например, К. Л. Фортескью умер более 30 лет
назад на момент написания статьи, а в томе 55, выпуске 11 ([1] (https://ieeexplore.ieee.org/xpl/tocresult.j
sp?isnumber=31102&punumber=5)) нет ни одной статьи, которая хотя бы отдалённо соответствовала
информации, приведённой в третьем пункте примечаний.
UTM–метки
ChatGPT может добавлять параметр UTM utm_source=openai или, в ссылках до августа 2025 года,
utm_source=chatgpt.com к URL-адресам, используемым в качестве источников. Другие LLM, такие
как Gemini или Claude, используют метки UTM реже.
Примеры
После свадьбы Берджесс и Грэм обосновались в Чешире, Англия, где Берджесс
работает главным тренером команды регбийной лиги «Уоррингтон Вулвз»
[https://www.theguardian.com/sport/2025/feb/11/sam-burgess-interview-warringtonrugby-league-luke-littler?utm_source=chatgpt.com]
В документации и блогах Vertex AI описываются водяные знаки, рабочий процесс
проверки и настраиваемые фильтры безопасности (например, элементы
управления генерацией персон и пороговые значения безопасности)
([cloud.google.com](https://cloud.google.com/vertex-ai/generativeai/docs/image/generate-images?utm_source=openai))
Имитация диалога
Слова-маркеры: Я надеюсь, это помогло Вам, Конечно,
Безусловно, Вы абсолютно правы, Если хотите спросить
что-то ещё, дайте мне знать ..., более подробный анализ,
Сообщите мне ...
ВП:Конечно
Иногда редакторы по ошибке могут вставлять в статью служебные фразы чат-бота — например, те, что
предназначены для начала диалога или дают советы, а не несут полезную информацию. Другой
признак — когда ИИ в самой статье заявляет, что текст написан для Википедии и полностью
соответствует всем её правилам.
Примеры
Эта вымышленная статья сочетает в себе стиль статьи из Википедии и
запрошенные вами элементы, включая дату анонса, дату выхода, новый актёрский
состав и съёмочную группу сиквела. Сообщите мне, если хотите, чтобы статья была
расширена или адаптирована!
— Из Draft:A Knight's Tale: The Legend Continues
Конечно, вот черновик статьи Марка Бирама в стиле Википедии, написанный в
нейтральном, энциклопедическом тоне и отформатированный в соответствии с
правилами Википедии. Предполагается, что значимость статьи подтверждается
независимыми источниками (которые необходимо цитировать для настоящей
страницы в Википедии):
— Из этой версии статьи Draft:Mark Biram
Отказ от ответственности и отсутствие источников
Слова-маркеры: по состоянию на [дата], На момент
моего обучения, По состоянию на момент
обновления моей базы данных, Хотя конкретные
детали ограничены/скудны..., не широко доступны/
задокументированы/разглашены, <...> в
предоставленных/доступных источниках/
результатах поиска.../на основе имеющейся
информации... ...
ВП:ИИДИСКЛЕЙМЕР
Отказ от ответственности за ограниченностью объёма знаний «классическое» заявление,
используемое чат-ботом на основе искусственного интеллекта, чтобы указать, что предоставленная
информация может быть неполной, неточной или устаревшей.
У любой языковой модели есть предел знаний, установленный датой её последнего обучения.
Например, модель, чьи данные обновлялись до 2023 года, ничего не знает о более поздних событиях.
В таких случаях она обычно предупреждает пользователя, что информация актуальна только на
указанную дату.
Если ИИ с доступом к поиску не может найти в интернете данные по запросу, он часто действует по
похожей схеме: сначала заявляет, что информации немного, а затем всё равно генерирует текст. Этот
текст почти всегда является спекуляцией, он может быть основан на слабо связанных темах или
просто выдуман, включая и само утверждение о том, что тема «не задокументирована».
Пока конкретная информация о фауне Студничной горы ограничена в
предоставленных результатах поиска, гора, вероятно, малоизвестна......
— Из этой версии статьи Studniční hora
Хотя подробности усилий сопротивления не задокументированы широко, они
подчеркивают её храбрость......
— Из этой версии статьи Throwing Curves: Eva Zeisel
По состоянию на июнь 2025 года не было зафиксировано никаких существенных
публичных скандалов или инцидентов, связанных с безопасностью,
затрагивающих Outpost24.
— Из Draft:Outpost24
По состоянию на моё последнее обновление знаний в январе 2022 г. У меня нет
конкретной информации о текущем статусе или развитии событий, связанных с
«Честерским центром психического здоровья» на сегодняшний день.
— Из статьи Chester Mental Health Center
Ниже представлен подробный обзор, основанный на имеющейся информации:
— Из :en:Draft:The Good, The Bad, The Dollar Menu 2|Draft:The Good, The Bad, The
Dollar Menu 2
В обсуждениях
При выставлении на удаления статей участников (часто новичков, не ознакомленных с правилами)
они пытаются защитить свою позицию с помощью ИИ, что видно по шаблонным фразам.
Примеры
Тема: Запрос на редактирование статьи в Википедии
Уважаемые редакторы Википедии,
Надеюсь, это сообщение застанет вас в добром здравии. Я пишу, чтобы попросить
отредактировать статью в Википедии.
Я выявил область в статье, требующую обновления/улучшения. [Опишите
конкретный раздел или контент, который необходимо отредактировать, и укажите
четкие причины необходимости редактирования, указав надежные источники,
если применимо]
— Из этой версии статьи Talk:Spaghetti
Тема: Опасения по поводу неточной информации
Дорогие модераторы Википедии
Я пишу, чтобы выразить глубокую обеспокоенность распространением
дезинформации на вашей платформе. В частности, я имею в виду статью о [Имя
артиста], который, по моему мнению, содержит неточную и даже вредную
информацию.
— Из этой версии статьи Talk:Kjersti Flaa
Речевые обороты
Параллелизмы с уточнениями
ВП:ИИПАРАЛЛЕЛЬ
Параллельные конструкции, включающие «не», «но» или «однако», такие как «Не только... но и...»
или «Это не просто о..., это...», часто встречаются в творчестве ИИ и совсем не подходят для
написания в нейтральном тоне.
Примеры
Автопортрет Яёи Кусамы, созданный в 2010 году и в настоящее время
хранящийся в знаменитой галерее Уффици во Флоренции, представляет собой не
только работу по саморепрезентации, но и визуальный документ её одержимостей,
визуальных стратегий и психобиографических повествований.
— Из этой версии статьи Self-portrait (Yayoi Kusama)
Речь идет не только о бите, идущем под вокал, а ещё и о части агрессивной
атмосферы.
— Из этой версии статьи Draft:Critikal! The Rapper
«Правило трёх»
Большие языковые модели злоупотребляют «правилом трёх». Оно может принимать различные
формы: от «прилагательное, прилагательное, прилагательное» до «короткая фраза, короткая фраза и
короткая фраза». ИИ часто использует эту структуру, чтобы их поверхностный анализ выглядел более
полным и правдивым.
Примеры
Конференция Amaze объединяет специалистов по поисковой оптимизации (SEO),
маркетологов и специалистов по росту роста со всего мира для обсуждения
последних тенденций в цифровом маркетинге. Мероприятие включает в себя
основные доклады, «панельные дискуссии» и возможности для нетворкинга..
— Из Draft:Amaze Conference
Обтекаемые формулировки
Слова-маркеры: Отраслевые отчёты, По словам экспертов,
Некоторые критики утверждают ...
ВП:ИИОФ
Чат-боты с искусственным интеллектом склонны приписывать мнения или утверждения некоему
расплывчатому авторитету (это называется обтекаемой формулировкой или неопредлённым
выражением), ссылаясь при этом лишь на один-два источника, которые могут фактически выражать
эту точку зрения, а могут и не выражать. Они также склонны чрезмерно обобщать точку зрения
одного или нескольких источников, превращая её в точку зрения более широкой группы.
Примеры
В данном случае обтекаемая формулировка подразумевает, что мнение исходит из независимого
источника, но на самом деле это ссылка на собственный веб-сайт музыканта.
Его [Ника Форда] композиции описываются как исследование концептуальных тем и
преодоление разрывов между художественными средствами.
Из Draft:Nick Ford (musician)
Благодаря своим уникальным характеристикам река Хаолай представляет интерес
для исследователей и специалистов по охране природы. Ведётся мониторинг её
экологического состояния и сохранение окружающей пастбищной среды, что является
частью более масштабной инициативы по защите полузасушливых экосистем Китая
от деградации.
Избегания частого повторения слов (тавтологии)
Генеративный ИИ имеет код остановки за повторение, призванный удержать его
ВП:ИИТАВТ
от тавтологии. Например, ответ может содержать имя главного героя, а затем
повторно использовать другой синоним или связанный термин (например, главный герой, ключевой
игрок, персонаж с таким же именем) при каждом его упоминании.
Стоит отметить, если пользователь добавляет несколько фрагментов контента, созданного ИИ, в
отдельных правках, этот признак может не применяться, поскольку каждый фрагмент текста мог быть
создан изолированно.
Пример
Верни, побывав в Москве в начале 1970-х годов, решил поддержать художников,
сопротивляющихся ограничениям социалистического реализма, и открыл для
себя Янкилевского, среди прочих, таких как Илья Кабаков и Эрик Булатов. В
непростой обстановке советских художественных ограничений, Янкилевский, как
и другие художники-нонконформисты, сталкивался с препятствиями. в свободном
самовыражении. Дина Верни, признавая огромный талант и трудности этих
художников, которые им пришлось пережить, сыграла ключевую роль в
содействии их художественным устремлениям. [...]
В этой новой главе своей жизни Янкилевский оказался в сообществе
единомышленников, которых, несмотря на разнообразие стилей, объединяла
общая цель — освободиться от рамок навязанных государством художественных
норм, в частности, социалистического реализма. [...]
Переезд в Париж создал условия, в которых Янкилевский смог глубже исследовать
и демонстрировать своё самобытное художественное видение будучи не
скованным ограничениями советского режима. Неизменная поддержка и
преданность Дины Верни русским авангардистам сыграли решающую роль в
создании пространства, где их творчество могло процветать, внося свой вклад в
богатую палитру художественного самовыражения в яркий культурный ландшафт
Парижа. Кульминацией деятельности Верни стала новаторская выставка «Русский
авангард – Москва 1973» в её галерее Сен-Жермен-де-Пре, которая представила
разнообразный, но единый фронт художников-нонконформистов бросающих
вызов художественным нормам своего времени.
— Из этой версии статьи Vladimir Yankilevsky
Крайности
ИИ часто использует меризм — стиль речи, который объединяет две крайности
ВП:ЛОЖДИА
для контрастного обозначения целого (от лёгкого до тяжёлого; от зимы до осени;
от головы до пят). LLM очень любят смешивать, приводя несколько крайностей вместо того, чтобы
просто перечислять их один за другим. Часто эти диапазоны «от и до» бессмысленны, потому что две
крайности слабо связаны между собой и никакую осмысленную порядковую шкалу вести невозможно.
Примеры
Наше путешествие по Вселенной привело нас от сингулярности Большого взрыва
к грандиозной космической паутине, от рождения и смерти звёзд, создающих
элементы жизни, к загадочному танцу тёмной материи и тёмной энергии,
формирующих её судьбу.
[...]
Интеллект и креативность: от решения проблем и создания инструментов до
научных открытий, художественного самовыражения и технологических
инноваций человеческий интеллект характеризуется своей адаптивностью и
способностью к новым решениям.
— Из Draft:The Cosmos Unveiled: A Grand Tapestry of Existence
Разметка
Использование Markdown
ИИ не владеет wikitext’ом, языком разметки, используемым по умолчанию на движке MediaWiki (в
том числе и в Википедии). Хотя есть и другие движки, например «Miraheze», использующие wikitext,
LLM, как правило, не обучаются на данных в формате викитекста. Хотя чат-боты при обучении
действительно поглощали миллионы статей Википедии, они обрабатывались не как текстовый файл.
Это усугубляется тем фактом, что большинство чат-ботов настроены на использование другого,
концептуально похожего, но гораздо более разнообразно применяемого языка разметки: Markdown.
Именно с его помощью LLM и выводят текст в ответах пользователю, который автоматически
форматируется так же, как и викитекст.
Когда чат-бота спрашивают о его «правилах форматирования», он готов раскрыть некоторые из своих
инструкций системного уровня, и он обычно генерирует что-то вроде следующего (Microsoft Copilot в
середине 2025 года):
## Руководство по форматированию
- Для всех выходных данных используется Markdown, адаптированный для GitHub.
- Используйте одну решётку для заголовка (`#`) и две для подзаголовков (`##`).
- Соблюдайте краткость абзацев (3–5 предложений, ≤150 слов).
- Разбивайте крупные темы на маркированные подразделы.
- Представляйте связанные элементы в виде маркированных или нумерованных списков; нумеруйте только тогда, когда порядок важен.
- Всегда оставляйте пустую строку перед и после каждого абзаца.
- Избегайте выделения жирным шрифтом или курсивом основного текста, если это явно не указано.
- Используйте горизонтальные разделители (`---`) между секциями.
- Используйте таблицы Markdown для структурированных сравнений или сводок данных.
- Воздержитесь от сложных символов Unicode; придерживайтесь простых символов.
- Оставляйте место для кода, стихотворений, текстов песен или аналогично отформатированного содержимого.
- Для математических выражений используйте LaTeX вне блоков кода.
Как следует из вышесказанного, синтаксис Markdown полностью отличается от синтаксиса
викитекста: Markdown использует звездочки (*) или подчеркивания (_) вместо одинарных кавычек (')
для жирного и курсивного форматирования, символы решетки (#) вместо знаков равенства (=) для
заголовков разделов, круглые скобки (()) вместо квадратных скобок ([]) вокруг URL-адресов и три
символа (---, *** или ___) вместо четырех дефисов (----) для тематических разделов.
Даже когда им прямо говорят об этом, чат-ботам обычно трудно генерировать текст, используя
синтаксически правильный викитекст, поскольку их тренировочные данные приводят к значительно
большей склонности к Markdown и беглому владению им. Когда чат-боту говорят «сгенерировать
статью», он обычно по умолчанию использует Markdown для генерируемого вывода. Если ему дать
команду генерировать контент для Википедии, чат-бот может «осознать» необходимость генерации
совместимого с Википедией кода и может включить в свой вывод сообщение типа «Хотите ли вы,
чтобы я ... преобразовал это в формат разметки Википедии (`wikitext`)?». Если пользователь
согласился, полученный синтаксис часто оказывается рудиментарным, синтаксически неверным или
и тем, и другим.
Наличие ошибочного синтаксиса викитекста, смешанного с синтаксисом Markdown, является
убедительным признаком того, что контент сгенерирован LLM. Однако Markdown сам по себе не такой
нишевый, как викитекст. Разработчики программного обеспечения, исследователи, программисты и
опытные интернет-пользователи часто используют Markdown в таких инструментах, как Obsidian и
GitHub, а также на таких платформах, как Reddit ([2] (https://support.reddithelp.com/hc/en-us/articles/
360043033952-Formatting-Guide)), Discord ([3] (https://support.discord.com/hc/en-us/articles/21029861
7-Markdown-Text-101-Chat-Formatting-Bold-Italic-Underline)) и Slack ([4] (https://slack.com/help/article
s/202288908-Format-your-messages)}. Некоторые инструменты и приложения для заметок, такие как
«Заметки» на iOS, Google Документы и Windows Notepad, поддерживают редактирование и экспорт
Markdown. Растущая повсеместность Markdown также может привести к тому, что новые редакторы
будут предполагать, что Википедия поддерживает Markdown по умолчанию.
Примеры
Я считаю, что эта блокировка стала необоснованной как с точки зрения
процедуры, так и по существу. Несмотря на неоднократные заявления о чётких,
основанных на политике опасениях, каждый запрос на разблокировку был
встречен **общим отказом** — основанным не на конкретных различиях или
нарушениях политики, а на **домыслах о мотивах**, утверждениях о своей
«бесполезности» и общем впечатлении, что я здесь «не для того, чтобы создавать
энциклопедию». Никто не прокомментировал тот факт, что я **не вносил
деструктивных правок**, **не участвовал в борьбе за права** и постоянно пытался
**сотрудничать в обсуждениях на странице обсуждения**, ссылаясь на политику и
предлагая разъяснения. Вместо этого я столкнулся с пренебрежительным
отношением со стороны нескольких администраторов, которые отмахивались от
обоснованных опасений по поводу **внутритекстовой атрибуции партийных или
интерпретационных заявлений**. Вместо того чтобы разобраться в моих
опасениях,
некоторые
редакторы
предпочитают
высмеивать,
строить
предположения о моих мотивах или называть мои аргументы «сгенерированными
ИИ» — не объясняя, в чем их существенная ошибка.
[[Category:AfC submissions by date/<0030Fri, 13 Jun 2025 08:18:00 +0000202568 2025-0613T08:18:00+00:00Fridayam0000=error>EpFri, 13 Jun 2025 08:18:00 +0000UTC00001820256 UTCFri, 13 Jun
2025 08:18:00 +0000Fri, 13 Jun 2025 08:18:00 +00002025Fri, 13 Jun 2025 08:18:00 +0000: 17498026806Fri,
13 Jun 2025 08:18:00 +0000UTC2025-06-13T08:18:00+00:0020258618163UTC13 pu62025-0613T08:18:00+00:0030uam301820256 2025-06-13T08:18:00+00:0008amFri, 13 Jun 2025 08:18:00 +0000am2025-0613T08:18:00+00:0030UTCFri, 13 Jun 2025 08:18:00 +0000 &qu202530;:&qu202530;.</0030Fri, 13 Jun 2025
08:18:00 +0000202568>June 2025|sandbox]]
— Из этой версии статьи User:Dr. Omokhudu Idogho
Несуществующие категории
LLM иногда видят несуществующие категории (которые отображаются красными ссылками),
поскольку их обучающая выборка содержит устаревшие и переименованные категории, которые они
воспроизводят в новом контенте. Они также могут воспринимать обычные викиссылки на темы как
категории, создавая таким образом несуществующие категории. Обратите внимание, что это также
распространённая ошибка новых или вернувшихся редакторов.
Стиль
Заглавная буква
В заголовках разделов чат-боты на основе искусственного интеллекта имеют
тенденцию писать все слова с заглавной буквы.
ВП:ИИЗБ
Примеры
Ранняя Жизнь и Образование
Томас родился в Кокранвилле, штат Пенсильвания. [...]
Участие В Гонках
Поведенческое
профилирование
Кентуккийского Дерби [...]
Томаса
использовалось
для
оценки
— Из Draft:Kerry M. Thomas
Чрезмерное использование жирного шрифта
ИИ-чат-боты часто злоупотребляют жирным шрифтом, выделяя текст бессмысленно. Эта привычка
перенята из инструкций, рекламы и списков, где жирный шрифт используют часто. В таких
документах принято выделять каждое упоминание ключевого термина, как в «главных выводах».
Некоторые современные модели уже получают инструкции не перегружать текст выделениями.
Пример
Он сочетает в себе OKR (Цели и ключевые результаты), KPI (Ключевые
показатели эффективности) и вмзуальные стратегические инструменты,
такие как Business Model Canvas (BMC) и Balanced Scorecard (BSC). OPC
призван сократить разрыв между стратегией и ее реализацией, способствуя
формированию единого мышления и единого направления в организациях.
— Из Draft:One Page 4 Change (OPC)
Вертикальные списки с заголовками
ИИ часто оформляет ответы в виде списков с особым форматированием: каждый пункт начинается с
жирного заголовка, после которого стоит двоеточие и основной текст.
При этом вместо стандартной вики-разметки бот может использовать необычные символы для
маркеров: точки, тире, решётки и эмодзи. В нумерованных списках он может явно проставлять
цифры. Если скопировать такой текст, его форматирование часто сбивается.
Пример
1. Исторический контекст Эпоха после Второй мировой войны: мир стремительно
менялся после Второй мировой войны, [...] 2. Гонка ядерных вооружений: после
атомных бомбардировок США Советский Союз взорвал свою первую бомбу в 1949
году, [...] 3. Ключевые фигуры Эдвард Теллер: венгерский физик, выступавший за
разработку более мощного ядерного оружия, [...] 4. Технические детали
водородной бомбы Sundial: конструкция Sundial включала водородную бомбу [...]
5. Разрушительный потенциал: при взрыве Sundial создаст огненный шар
диаметром до 50 километров, [...] 6. Последствия и реакции Глобальное
воздействие: взрыв приведет к апокалиптической ядерной зиме, [...] 7.
Политические реакции: американские военные и ученые выразили ужас по поводу
последствий такого оружия, [...] 8. Современные последствия Текущий ядерный
арсенал: на сегодняшний день в мире насчитывается около 12 000 единиц
ядерного оружия, [...] 9. Основные выводы Понимание безумия: Концепция
проекта
«Солнечные
часы»
подчеркивает
крайности
человеческой
изобретательности [...] 10. Вопросы для рассмотрения Каковы были мотивы
разработки проекта «Солнечные часы»? [...]
— Из этой версии статьи Sundai (weapon)
Злоупотребление длинными тире
ИИ часто злоупотребляют длинным тире (—), используя его шаблонно и слишком часто, копируя
навязчивый рекламный стиль. Это происходит потому, что модели обучались на художественной
литературе, где авторы активно используют этот знак.
Люди в подобных текстах чаще ставят запятые, скобки или двоеточия. Хотя этот признак сам по себе
не доказательство, в сочетании с другими странностями он помогает выявить ИИ.
Примеры
Элвандор — это виртуальное микрогосударство для людей с энтузиазмом и
мастерством. Место, где можно строить, творить и помогать друг другу расти в
погоне за богатством — но не ради жадности, а ради того, чтобы делиться,
помогать другим, жертвовать.
— Из этой версии статьи Draft:United Digital Republic Of Elwandore
См. также
Википедия:Искусственный интеллект
Источник — https://ru.wikipedia.org/w/index.php?title=Википедия:Признаки_сгенерированности_текста&oldid=149696963
Эта страница в последний раз была отредактирована 10 ноября 2025 года в 15:10.
Текст доступен по лицензии Creative Commons «С указанием авторства — С сохранением условий» (CC BY-SA); в
отдельных случаях могут действовать дополнительные условия.
Wikipedia® — зарегистрированный товарный знак некоммерческой организации «Фонд Викимедиа» (Wikimedia Foundation,
Inc.)

Признаки сгенерированного ИИ текста

Похожие документы

Разделы

Поддержка

Признаки сгенерированного ИИ текста

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить Pubdoc