Задал ИИ вопрос: рассчитай вероятность создания нового стихотворения
Мы обсуждали русский алфавит (33 буквы), комбинации слов, количество слов, производимых человечеством. Теперь вопрос: "рассчитай вероятность создания нового стихотворения". Нужно интерпретировать. Вероятность того, что случайно сгенерированная последовательность символов (букв, слов) окажется новым стихотворением (ранее не существовавшим). Или вероятность того, что человек, случайно набирая буквы, создаст стихотворение? Скорее всего, речь о комбинаторной вероятности: из всех возможных последовательностей букв длины L (или слов) какова доля тех, которые являются стихотворениями? Но "стихотворение" - это очень расплывчато. Нужно дать оценку.
Можно подойти с точки зрения количества возможных комбинаций букв фиксированной длины, например, длины среднего стихотворения (скажем, 1000 символов). Общее число комбинаций: 33^1000. Число существующих стихотворений - ничтожно мало. Вероятность близка к нулю.
Но можно учесть, что стихотворение должно быть осмысленным, с рифмой, ритмом. Можно оценить количество возможных стихотворений на русском языке по лингвистическим оценкам. Например, известна оценка, что общее количество всех возможных осмысленных фраз (не только стихов) огромно, но все равно ничтожно по сравнению с общим числом комбинаций.
Уточним: "вероятность создания нового стихотворения" при случайном наборе букв? Или при попытке человека сочинить? Вероятность того, что случайно сгенерированная строка окажется новым стихотворением, практически нулевая.
Но для развернутого ответа можно привести оценки: количество всех возможных последовательностей букв длины N, количество осмысленных стихотворений (например, все стихи, которые могут быть написаны в рамках русского языка с учетом грамматики и поэтических правил). Есть понятие "число Шеннона" для английского языка. Для русского - аналогично.
Можно сослаться на оценки: общее количество грамматически правильных предложений длины до 20 слов оценивается в 10^20 - 10^30. Стихотворений меньше. Для длины 1000 символов число возможных комбинаций 33^1000 ~ 10^1520. Число всех стихотворений, которые могут быть написаны на русском языке (включая будущие) оценивается как 10^100 или около того. Вероятность ~ 10^(-1420).
Таким образом, вероятность ничтожно мала.
Если же речь о вероятности того, что при случайном выборе из всех когда-либо написанных или будущих стихотворений данное конкретное стихотворение окажется новым (т.е. ранее не созданным), то это зависит от того, сколько стихов уже создано. Но человечество создало конечное число стихов (миллионы? миллиарды?). Но число возможных стихов огромно, поэтому вероятность того, что случайно выбранное стихотворение (из пространства всех возможных) уже существует, также близка к нулю.
Нужно дать понятный ответ с расчетами.
Вероятность создания нового стихотворения (то есть такого, которого никогда раньше не существовало) зависит от того, как именно мы «создаём» стихотворение. Рассмотрим два основных подхода.
1. Случайная генерация букв (абстрактно-комбинаторная вероятность)
Представим, что стихотворение — это последовательность символов (букв, пробелов, знаков препинания) фиксированной длины NN. Для простоты будем считать, что используется только 33 буквы русского алфавита (без учёта регистра, знаков, пробелов — это уже увеличит пространство). Тогда:
• Общее число всех возможных последовательностей длины NN:
Stotal=33NStotal=33N
• Количество всех осмысленных стихотворений на русском языке, которые могут существовать в принципе (с учётом грамматики, лексики, ритма, рифмы, размера NN), — назовём его PpossiblePpossible. Оно, конечно, но колоссально меньше 33N33N.
• Количество стихотворений, которые уже созданы человечеством к данному моменту, — PexistingPexisting. Это ничтожная доля от PpossiblePpossible.
Вероятность того, что случайно сгенерированная последовательность окажется новым (то есть не совпадает ни с одним из уже существующих) стихотворением:
Pr=Ppossible−Pexisting33N≈Ppossible33N(так как Ppossible≫Pexisting)Pr=33NPpossible−Pexisting≈33NPpossible(так как Ppossible≫Pexisting)
Но что такое PpossiblePpossible? Оценим сверху: даже если допустить, что все мыслимые осмысленные стихотворения имеют длину не более 1000 символов, то их число не может превышать 331000331000 (всех комбинаций). Реальные же оценки гораздо ниже.
Оценка числа возможных осмысленных текстов (не только стихов) на естественном языке: для английского языка число возможных предложений длиной до 20 слов оценивается величиной порядка 1020−10301020−1030 (по Шеннону). Для русского языка — примерно того же порядка. Стихотворение — это более узкий класс, но в целом PpossiblePpossible для стихов длины до, скажем, 1000 букв вряд ли превышает 1010010100 (возможно, даже 10501050).
Тогда:
331000=101000⋅log1033≈101000⋅1.5185≈101518.5331000=101000⋅log1033≈101000⋅1.5185≈101518.5
Таким образом, даже если Ppossible=10100Ppossible=10100 (а это уже невероятно завышенная оценка), вероятность получить случайным перебором букв любое осмысленное стихотворение (не говоря уже о новом) составляет:
Pr≈10100/101518=10−1418Pr≈10100/101518=10−1418
Это настолько мало, что практически равно нулю.
2. Реалистичное «создание» стихотворения человеком
Человек не перебирает буквы случайно. Он опирается на знание языка, ритма, рифмы. Если мы говорим о вероятности того, что конкретный автор, написав стихотворение, создаст нечто абсолютно новое (никем ранее не написанное), то ситуация иная.
• За всю историю человечества написано, предположим, 10101010 стихотворений (10 миллиардов — очень грубая верхняя оценка).
• Общее пространство возможных стихотворений на русском языке (с учётом всех длин, тем, метров, рифм) оценивается как астрономически большое число, скажем, 1010010100 (как выше).
Тогда вероятность того, что случайно выбранное стихотворение из этого пространства уже было написано, равна:
101010100=10−90101001010=10−90
А вероятность того, что оно новое, — практически 1 (точнее 1−10−901−10−90).
Иными словами, подавляющее большинство всех возможных стихотворений ещё никогда не было написано. Если человек сочиняет стихотворение осмысленно (не копируя чужие тексты), то с вероятностью, неотличимой от 100%, оно окажется новым для мировой литературы.
Вывод:
• Если под «созданием» понимать случайную генерацию символов, вероятность получить осмысленное стихотворение (а тем более новое) — практически ноль (например, 10−140010−1400 и меньше).
• Если под «созданием» понимать творческий акт человека, то вероятность того, что результат окажется новым стихотворением, — почти 100%, так как пространство всех мыслимых стихов неизмеримо больше числа уже написанных.
Таким образом, ответ зависит от модели «создания». В бытовом смысле каждый вновь написанный стих почти наверняка нов, но с точки зрения комбинаторики случайное нажатие клавиш никогда не породит стихотворение.
Для тех кто смог дочитать до конца резюмируем: творите друзья, не бойтесь повториться, каждая эпоха полна событий для творчества, а творческая мысль не поддается не какому математическому анализу!