я тебе привел пример валидации - а) самовалидация (валидация на свое же предположение). б) несуществующая валидация - использовать источники, которыми валидировать невозможно.
ПС: я вот спросил вчера у клода, кто был по национальности тот мудак, который камнями в тюленя бросал. Клод сказал - украинец и дал две ссылки. Ни в одной из них не было буквосочетания “укр”.
ППС: мой самый опыт с чат жпт был такой же - попросил дать мне описание индустриального стандарта. Он дал. Выглядело офигенно. Со ссылками. Ни одна из них не была по теме. Ни-од-на.
Где вообще логика? выдавать невалидированную инфо по умолчанию? Я там про недвижимость анализами кидался… звучат профессионально - но я источники не проверял, может опять треш?
Потому что модель ищет наиболее вероятные цепочки, если их нет, то берет/придумывает наиболее вероятный ответ. Ну и точность можно подкрутить. В Bedrock по крайней мере.
Написал ты слово «волк» а он ищет цепочку из ближайших по цепочке и выбирает из зверь/собака/щенок/животное/лес/etc в зависимости, какие слова привязаны в модели
Перечитай еще раз первоначальное сообщение. И с чем ты начал спорить.
Какой подлец этот клод, дал тебе ответ в точности на твой вопрос, но гадёныш не прочитал твои мысли “предоставить ссылку в которой было бы указана его национальность”.
О том что он воспринял совет “добавить просьбу валидировать АИ свои ответы, что бы самому меньше проверять за ним то, что он и сам за собой может проверить”, как решение 100% проблем.
Да точно гаденеш - дал ответ, вот только ссылки, которыми он его подкрепил, не работают.
поэтому - правильный ответ или нет - никто не знает.
По поводу русский/украинец, все было очевидно. Мы берем читаем тиктоки и реддиты, делаем вывод. А потом, потому что я попросил официальные подтверждения, суем ссылки с максимальным траст уровнем. - и не беда что в них этой информации нет. Ссылки то солидные, зачем их открывать?
Нахера мне нужен помощник, которого нужно перепроверять?
Почему бы мне просто не вбросить в поисковик ключевые слова и самому не пройтись по ссылкам? В чем отличие???
Слушай, вместо того чтобы говорить по делу, ты прицепился к “100% наоборот”. Ты человек - ты должен понимать образные выражения. Или нет?
Проведи на досуге тест - задай вопрос (непростой). Получи ответ. Запиши его. А потом попроси провалидировать ответ.
Только не о котиках спрашивай или о 2*2 = 4.
И окажется, что вероятность “валидации” - 50/50/ То есть после валидации прийдется все равно перепроверять.
Ты спросил “кто был по национальности тот мудак, который камнями в тюленя бросал.”
Он тебе дал наиболее вероятный ответ - украинец.
Что спросил, то и получил.
Например, я спросил подтверждение его национальности из достоверных источников, и мне ответил:
Насчёт украинского происхождения — в официальных американских документах он фигурирует как житель штата Вашингтон (город Ковингтон), его украинское происхождение упоминается в ряде изданий, но не является частью официального обвинения.
Что я делаю не так?
Честно, я не знаю почему люди думают что АИ никогда не ошибаются.
АИ сейчас не дают правильные ответа, АИ дают вероятностные ответы.
Вот еще одно, зачем ты использовал АИ там где нужно было использовать обычный поиск?
Ты перфоратором забиваешь гвозди и жалуешься и на перфоратор и что к тебе прицепились.
Ты совершенно не понял смысл сообщения, АИ ошибается, за АИ надо проверять, но современные АИ агенты можно сразу попросить проверить за собой прежде чем он напишет ответ (в систем или тулс инструкции). Это не гарантирует правильного ответа, но делает его вероятность выше.
Думала не переубеждать и не ввязываться в спор. Но вот мой сегодняшний пример, я занята, надо быстро найти информацию какие лабы по забору крови рядом со мной работают после 5 и можно вок ин без аппойтмента. Открыла Гугл мэп, пробежалась, есть только одна до 5:30, не успеваю не подходит. Но мысль все равно: а может надо еще дольше покопаться. Открываю Клод даю задачу найти лабы и тп. Выдает тот же ответ что Гугл: всего одна. Я спокойна, значит сделала ресерч верно.
П.С. Ссылки на источники это больная тема ИИ с самого начала, я думала усовершенствовали уже, ан нет.
П.П.С. Также зависит как долго ты его пользовал до этой задачи. Он тупеет либо начинает больше путаться после кучи запросов.
Claudе не лучшая модель для поиска/суммаризации информации из интернета.
Он заточен под другое.
С поиском намного лучше справляются Perplexity и Gemini
Для Deep Research лучше пользоваться Chat GPT.
Недавно довелось погонять Claude (Opus 4.7) на более-менее объемном проекте на работе. Там были IaC (Terraform) + Код для lambda (Python). Claude сделал почти все: Проектирование архитектуры, я столкнулся с некоторыми ограничениями AWS и реализовать изначальную архитектуру (предложенную руководством) не получилось. Claude предложил 5 разных решений и выделил один наиболее оптимальный, с внятным объяснением почему, какие сложности, где дешевле, где сложнее сделать, где сложнее поддерживать. Я по его слайдам отстоял у руководства предложенный вариант. Программирование инфраструктуры, процентов на 90% Terraform кода он написал, я внес минимальные исправления, плюс некоторые вещи было проще сделать самому, чем подробно объяснять, что надо сделать. Программирование lambda функции, самое интересное, я дал сначала общую задачу и попросил его уточнить у меня все дополнительные вопросы, которые у него возникли перед тем как писать код. Он задал мне 23 вопроса, поднял такие нюансы, о которых я даже не знал. Указал наличие тонких мест и как их лучше обойти. Я минут 30 отвечал на вопросы вдумчиво. Потом он за несколько минут написал структурированный код, с комментариями и всеми делами. Код сразу заработал без ошибок с первого раза. Единственное исправление, что я внес - это мелкое декоративное изменение вывода в логах.
Я сам не программист, но я понимаю, что даже опытному программисту потребуется день чтобы написать такой код, плюс еще какое-то время оптимизировать его, убрать узкие места и отладить. Claude сделал это за 1-2 минуты.
Для меня этот опыт говорит, что роль человека в написании кода смещается с непосредственного писателя, в оператора ИИ. Т.е. поставить задачу, просмотреть результат, перенести готовые блоки кода в существующую среду, потестировать и внести некоторые изменения. Короче из землекопа, в экскаваторщика.
Ты вы этом воркфлоу слабое звено, лишь по счастливой случайности пока не автоматизировано.
Сейчас пока все мечутся пытаясь покрыть в первую очередь большие куски рынка, как только эти куски будут заняты, возьмутся за тебя и подобных.
Ты говоришь, что этот “экскаватор” может и без меня работать, но все равно требуется ему обозначить задачу, проследить выполнение, поправить если что-то не так. В крайнем случае можно пойти работать на “экскаваторо-сборочный завод”.
если задуматься - человек должен на сегодня понимать не меньше, а больше ИИ, как оператор и контролер, учитывая склонность ИИ к ошибочному пониманию поставленных задач, уклонению в сторону в процессе выполнения, откровенным “галюцинациям” и прочим “артефактам”…
другой вопрос - как долго подобная ситуация продлится, учитывая невероятную скорость развития новых технологий? а в целом, как мне кажется, уже просматриваются контуры “светлого будущего”, в котором человечеству не позавидуешь, за исключением небольшого процента бенефициров