kot_kam: (Default)
[personal profile] kot_kam
Из комментов к предыдущему посту:

- Товарищ майор, почитав это, уже, поди, сделал заказ на нейросеть, распознающую коммуникативный уровень русского языка.
Одна надежда, что всё распилят, и в реальности будут просто считать частотность слова "ну".

- Если товарищ майор закажет такую нейросеть, да еще из своего кармана оплатит, да оно еще и взлетит... Его безвестное имя прославится в веках. ;-) Так и будут говорить: "нейросеть имени Неизвестного Майора".

А считать частотность слова "ну" (а также "а", "же", "вот" и прочих коммуникативных единиц), увы, ничем не поможет. Это все равно, что считать в тексте количество букв "е". Или количество нот соль в симфонии.

Date: 2023-02-09 08:06 am (UTC)
From: [identity profile] nasse.livejournal.com
Мне жутко интересно, как отобразился коммуникативный уровень русского языка (исходно - все-таки устный) в письменной речи.
И в современной недописьменной.

Date: 2023-02-09 08:42 am (UTC)
From: [identity profile] kot-kam.livejournal.com
Я могу тебе сказать, что в ней не отобразилось. Интонацию как следует передать невозможно. Почти. То есть нет однозначного соответствия интонационных конструкций (которых, как мы знаем, всего семь) любым письменным средствам. Я могу примерно сказать, что точка в конце предложения — ну, возможно, ИК-1. Или нет. ;-) Чаще всего по смыслу интонация достраивается — или нет. ;-)

Более тонкие интонационные средства — когда как. Всякие там растягивания и нажимы ("Я т-тебе!.. Вот ка-ак щас!..") прекрасно на письме передаются. Глагольные формы (которые тоже работают только в путь: ср. "Принесите кофе" — "Кофе принесла!") — тем более передаются. Вербальные коммуникативные единицы — ну, не вопрос, на письме именно они больше всего и работают.

Date: 2023-02-09 09:04 am (UTC)
From: [identity profile] nasse.livejournal.com
Это понятно.

Но ща в ходу какие-то дополнительные коммуникативные средства, типа смайликов, расширенного понимания синтаксиса и намеренно неправильной орфографии.
Они не пытаются заменить интонацию.
Но они определенно имеют отношение к коммуникативному уровню, причем речи не звучащей.

(И вот то, что нынешние разговорные жанры — исходно письменные, предполагающие именно восприятие глазами, а не востроизведение интонации в голове — уже что-то новое)

Date: 2023-02-09 10:49 am (UTC)
livelight: (starlight)
From: [personal profile] livelight
> расширенного понимания синтаксиса

Это вы про что?

> смайликов

Rак нынче некоторые ругаются на смайлики, что это для дебилов, которые текстом неспособны мысль передать, точно так же некогда некоторые ругались на вопросительные-восклицательные знаки и прочие вводимые в письменность знаки пунктуации.

Date: 2023-02-09 11:02 am (UTC)
From: [identity profile] nasse.livejournal.com
>> расширенного понимания синтаксиса

> Это вы про что?

Сорри. Не синтаксиса, конечно. Пунктуации.
Мне уже попадались дискуссии о том, является ли точка в конце предложения в чате оскорбительной.

>> смайликов

> Rак нынче некоторые ругаются на смайлики, что это для дебилов, которые текстом неспособны мысль передать, точно так же некогда некоторые ругались на вопросительные-восклицательные знаки и прочие вводимые в письменность знаки пунктуации.

Имхо, на обычные смайлики уже никто не ругается, смирились. Теперь ругаются на стикеры :)

(Имхо, смалики как раз местами пытаются заменить отсутствующую интонацию)
Edited Date: 2023-02-09 11:04 am (UTC)

Date: 2023-02-09 11:10 am (UTC)
livelight: (hot)
From: [personal profile] livelight
> Теперь ругаются на стикеры :)

На стикеры я тоже ругаюсь, потому что их всегда шлют ВМЕСТО осмысленного текстового сообщения.
Смайлики, впрочем, иногда тоже шлют вместо, а не в дополнение.

> является ли точка в конце предложения в чате оскорбительной

В принципе, почему бы и нет, если это чат, в котором все свои и приняли такие правила коммуникации. Если же в чат регулярно попадают люди со стороны, которые не в курсе таких соглашений и ставят или не ставят точку в зависимости от чего угодно ещё, то следить за точками — только нервы зря тратить.

> смалики как раз местами пытаются заменить отсутствующую интонацию

Мне нравится коммуникативный знак /s (в значении sarcasm, а не strikethrough). Ибо наличие смайлика вовсе не гарантированно укажет читающему на сарказм. Закон По суров, и его незнание не освобождает от ответственности.

Date: 2023-02-09 11:17 am (UTC)
From: [identity profile] nasse.livejournal.com
/s я сейчас однозначно прочитала как "параметр командной строки от какой-то виндовой команды"

А в чат сейчас люди попадают, потому что их поставили перед фактом.

А на стикеры я ругаюсь, потому что они большие, цветные и дергаются. И категорически мешают читать текст, если даже он был. (А понимать стикеры я просто не способна)
Edited Date: 2023-02-09 11:19 am (UTC)

Date: 2023-02-09 11:20 am (UTC)
livelight: (lightning)
From: [personal profile] livelight
Наверное, хабр мало читаете :)
Там в каментах любят тэги sarcasm и /sarcasm (с произвольными скобками, включая треугольные или никакие), иногда ограничиваясь только закрывающим /s

Date: 2023-02-09 11:22 am (UTC)
From: [identity profile] nasse.livejournal.com
В хабре я не читаю комменты

Date: 2023-02-09 02:42 pm (UTC)
From: [identity profile] right-to-cry.livejournal.com
Если вы про стикеры в телеграме, там можно отключить их анимацию в настройках.

Date: 2023-02-09 02:57 pm (UTC)
From: [identity profile] nasse.livejournal.com
Действительно

Date: 2023-02-09 09:07 am (UTC)
From: [identity profile] nasse.livejournal.com
PS Ты ИК уже освоил?

Date: 2023-02-09 09:34 am (UTC)
From: [identity profile] kot-kam.livejournal.com
Не-ет... :-(

Ну в смысле как: владеть-то владею, а вот определять — хуюшки.

Date: 2023-02-09 09:36 am (UTC)
From: [identity profile] a-konst.livejournal.com
Нене, "кофе принесла!" совсем не считывается на письме.
Это может быть и констатация факта, что уже принесла, просто радостная. Отличие от хамского приказания именно в голосовой интонации.

Date: 2023-02-09 10:24 am (UTC)
From: [identity profile] kot-kam.livejournal.com
Я нарочно не стал писать "Кофе принесла, быро!" Внутри ситуации из контекста должно быть понятно. А вне ситуации коммуникативный уровень и не работает.

Date: 2023-02-09 10:32 am (UTC)
From: [identity profile] a-konst.livejournal.com

Слегка позанудствую — в реальном мире контекст ситуации еще и очевиден в буквальном смысле — есть у человека кофе на столе или нет :D
А в тексте для этого придется специально этот контекст как-то описывать. Это уже художественное произведение получается. Там совсем другой коленкор.
Во флеймах на форумах (и в жж, и в прочих соцсеточках) над хорошим описанием контекста никто не парится вообще, и сплошь и рядом люди неправильно друг друга понимают.

Date: 2023-02-09 08:08 am (UTC)
From: [identity profile] gobis.livejournal.com

*пошла читать комментарии к предыдущему посту*

Date: 2023-02-09 08:39 am (UTC)
vitus_wagner: My photo 2005 (white)
From: [personal profile] vitus_wagner

Насчет нот соль. Помнится в свое время Лёша Ретеюм (который потом стал директором Аптекарского Огорода) поразил меня до глубины ушей, когда разглядывая под углом виниловую пластинку безошибочно находил там нужный фрагмент симфонии. Он потом объяснил что просто очень хорошо помнит где там громкие места, а где тихие, а вот громкость музыки по ширине дорожки на пластинке определить можно.


Date: 2023-02-09 08:56 am (UTC)
From: [identity profile] kot-kam.livejournal.com
Это как раз понятно, я тоже о таких вещах в свое время догадывался. :-)

Date: 2023-02-09 09:08 am (UTC)
From: [identity profile] spamsink.livejournal.com

На всякий случай и здесь скажу: я и имел в виду, что считать частотность коммуникативных единиц ничем не поможет, но не "увы", а к счастью. Большой Брат не пройдёт.

Date: 2023-02-09 09:36 am (UTC)
From: [identity profile] kot-kam.livejournal.com
На всякий случай и здесь скажу: за что нас с вами посадить, Большой Брат и так найдет, но если удастся сделать автоматическое распознавание (и воспроизведение) коммуникативного уровня, это будет колоссальный прорыв. Я даже так с ходу не возьмусь сказать, какие возможности это сулит. Но большие и хорошие.

Date: 2023-02-09 10:07 am (UTC)
From: [personal profile] borisk (from livejournal.com)
На распознавание коммуникативного уровня достаточно посадить тысячи две крепостных студентов или школьников-цзаофаней в три смены.

Date: 2023-02-09 10:25 am (UTC)
From: [identity profile] kot-kam.livejournal.com
Спасибо, поржал. Смотря чего вы от них хотите.

Date: 2023-02-09 10:40 am (UTC)
From: [personal profile] borisk (from livejournal.com)
Я надеюсь, что всевозможные добровольцы сделают Интернет настолько скучным, что мне будет труднее прокрастинировать ;)

А так — в иврите есть замечательное выражение:
מה שמודדים — זה מה שמשתפר

Date: 2023-02-09 02:57 pm (UTC)
From: [identity profile] kot-kam.livejournal.com
А теперь переведите, пожалуйста. :-) А то я только זה и понял.

Date: 2023-02-09 04:24 pm (UTC)
From: [personal profile] borisk (from livejournal.com)
«Что мерим — то и улучшается»

В данном случае — нейронная сеть разумеется будет в точности соответствовать численным и качественным критериям товарища майора. С плановым превышением показателей на один процент к празднику.

Date: 2023-02-09 05:24 pm (UTC)
From: [identity profile] spamsink.livejournal.com

Интересно, что было раньше: закон Гудхарта или это ивритское выражение.

Date: 2023-02-09 05:46 pm (UTC)
From: [personal profile] borisk (from livejournal.com)
С большой долей вероятности его привезли в израильский хайтек люди, которые стажировались в Америке.

Date: 2023-02-09 01:44 pm (UTC)
From: [identity profile] masterspammer.livejournal.com

Это как бы не стандартные дорожки конкурсов по NLP — определение агрессии, "токсичности", сарказма. Автоматическое определение возможно, хотя и не абсолютно точно, но порой неплохо.

Date: 2023-02-09 02:46 pm (UTC)
From: [identity profile] right-to-cry.livejournal.com
Именно. Как верно заметили тут https://kelijah.livejournal.com/312765.html, математика уже решила кучу задач, которые лингвистика не смогла.

Date: 2023-02-09 02:28 pm (UTC)
From: [identity profile] themalcolm.livejournal.com

Типа, возможности сажать за фигу в кармане?

Date: 2023-02-09 02:58 pm (UTC)
From: [identity profile] kot-kam.livejournal.com
Типа возможности озвучивать тексты роботом с нормальными человеческими интонациями. ;-) Причем именно с теми, которые имел в виду автор.

Date: 2023-02-09 03:03 pm (UTC)
From: [identity profile] themalcolm.livejournal.com

И оставить без работы актёроа, которые озвучивают аудиокниги сейчас? Другого применения этому я как-то не вижу.

Date: 2023-02-09 05:33 pm (UTC)
From: [identity profile] spamsink.livejournal.com

И оставить без работы телефонных мошенников, выманивающих деньги у пожилых людей с когнитивными нарушениями. Роботы, способные имитировать нормальные человеческие интонации, справятся с этим гораздо лучше.

Date: 2023-02-09 06:09 pm (UTC)
From: [identity profile] elvit.livejournal.com
Возможно, улучшить уровень автоматического перевода? Не уверена, но почему бы и нет.

Date: 2023-02-09 05:31 pm (UTC)
From: [identity profile] spamsink.livejournal.com

Правильно понимать и порождать лексические коммуникативные единицы и интонационные конструкции — две разные задачи.


Сейчас взял, кстати, и посмотрел, как гугл переводит "Да ну тебя!" Оказалось "Yah you". Ни разу такого не встречал, ни в речи, ни на письме.


Date: 2023-02-09 05:51 pm (UTC)
From: [personal profile] borisk (from livejournal.com)
Кстати, Microsoft Bing переводит как “oh well.” и именно с точкой в конце. Снижение интонации в переводе, по-моему, правильное.

Но при этом почему-то сначала определяет язык как украинский ;)

Date: 2023-02-09 05:58 pm (UTC)
From: [identity profile] spamsink.livejournal.com

"Oh well" в качестве перевода "Да ну тебя" — совсем неправильно.


Более традиционна фраза "Get away with you!", которую гугл сам по себе переводит на русский неправильно ("Уйди с тобой!" lol), но внизу даёт словарный перевод, именно "Да ну тебя".

Date: 2023-02-09 06:06 pm (UTC)
From: [personal profile] borisk (from livejournal.com)
Да, в Bing похоже этот перевод сломан. Он цепляется за два первых слова и игнорирует третье, как студент-троечник.

Date: 2023-02-09 06:14 pm (UTC)
From: [identity profile] elvit.livejournal.com
Яндекс решил, что это "Oh, come on!"
... точнее, у него оказалось сразу два варианта. Переводчик на странице ya.ru выдал "Кам он", а по адресу translate.yandex.ru предложил "О, да ладно тебе!"

Дипл первым вариантом дает No way!, дополнительными —
- Come on!
- Come on, man!
- Come on, you!

Profile

kot_kam: (Default)
kot_kam

January 2026

S M T W T F S
     1 23
45678910
11121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 2nd, 2026 04:35 pm
Powered by Dreamwidth Studios