Публикации по теме 'nlp'
Частота термина — Обратная частота документа
TF-IDF — это сокращение от термина «частота, обратная частоте документа». Это метод векторизации, используемый в области обработки естественного языка. Да, я знаю, это пугающая фраза, но поверьте мне, она намного проще, чем кажется.
Использование TF-IDF
Обработка естественного языка или НЛП — это область машинного обучения, которая занимается обработкой данных на естественном языке, включая, помимо прочего, комментарии пользователей, обзоры, анализ настроений и перевод текста...
Понимание НЛП и BERT
С удивительным прогрессом в области ИИ за последнее десятилетие мы прошли долгий путь. Разработано множество моделей, и результаты исследований доступны для обычных людей. Как и во многих областях исследований, у нас есть НЛП, область обработки естественного языка.
Сегодня в этом конкретном блоге мы поговорим о BERT, двунаправленной модели, разработанной Google. Это один из исторических скачков в области НЛП, сделанный исследователями, работающими в этой области на протяжении многих..
Jina AI + Qdrant → Хранение данных на лету!
Хранение данных в облаке
Jina AI + Qdrant → Хранение данных на лету!
Теперь вы можете использовать Qdrant в качестве хранилища документов для Jina DocArray для более быстрой обработки и поиска документов в облаке!
Введение
DocArray — это уникальная первая в своем роде структура данных для неструктурированных данных. Это часть более крупной экосистемы Jina AI. Он может вмещать все виды данных, включая текст, изображения, аудио, видео и т. д., и интуитивно понятен для..
Что нового в txtai 5.0
Семантический граф, внешние интеграции и многое другое
txtai — это платформа с открытым исходным кодом для семантического поиска и рабочих процессов, основанная на языковых моделях.
В следующих статьях ранее рассматривался txtai.
Представляем txtai, поисковую систему на основе искусственного интеллекта, созданную на основе Transformers Добавьте понимание естественного языка в любое приложение towardsdatascience.com..
Преобразование речи в текст: транскрибируйте аудио без написания единой строки кода.
Введение
Наиболее естественной формой человеческого общения является речь. Однако голос/речь не так семантически понимается существующими моделями ИИ, как текст. Разве не было бы здорово, если бы мы могли использовать речь в качестве интерфейса, интерпретируя эмоции и смысл, стоящие за ними, для значимого взаимодействия?
Преобразование речи в текст или автоматическое распознавание речи (ASR) именно это и устраняет.
Speech-to-Text от NeuralSpace — это технология, позволяющая..
Как Google Cloud упрощает проекты машинного обучения
Поскольку не только сложность моделей машинного обучения (ML), но и размер наборов данных продолжают расти, растет и потребность в мощности компьютера. В то время как большинство современных ноутбуков могут справиться со значительной рабочей нагрузкой, их производительности часто просто недостаточно для наших целей в dida. В следующей статье мы рассмотрим некоторые из наиболее распространенных узких мест и покажем, как облачные сервисы могут помочь ускорить работу.
Задний план..
10 лучших проектов НЛП для пополнения вашего портфолио
В этом блоге мы собираемся обсудить 10 лучших проектов НЛП, которые вы можете создать и сделать свое портфолио привлекательным в глазах интервьюеров.
Вы когда-нибудь задумывались о том, как Alexa понимает то, что вы говорите, или как разумно понимать ваши слова? Обработка естественного языка - это ответ!
Обработка естественного языка (NLP) относится к области компьютерных наук, а точнее к области искусственного интеллекта или ИИ, которая занимается предоставлением компьютерам..
Новые материалы
Мифы о машинном обучении
Машинное обучение прошло через несколько волн своего внедрения. С годами доступность данных увеличилась в геометрической прогрессии. В то же время мощность компьютеров увеличилась в соответствии..
Функциональное тестирование в JavaScript для начинающих
Функциональное тестирование является неотъемлемой частью процесса разработки программного обеспечения и особенно важно при работе с JavaScript. JavaScript — это универсальный и широко используемый..
Если вы используете CodeMirror, вам обязательно нужно это проверить
Представляем радужные скобки🌈
CodeMirror — невероятно мощный редактор кода в браузере. Хотя его API сложен, он дает разработчикам массу возможностей для создания IDE в браузере на любом..
Пришло время попрощаться с этими устаревшими библиотеками Python
Поскольку Python продолжает развиваться, некоторые библиотеки, которые когда-то широко использовались, устаревают. Эти устаревшие библиотеки могут вызывать проблемы совместимости, уязвимости в..
Привет, Зак Аргайл, сначала позвольте мне поблагодарить за эту статью, но я не думаю, что все ваши примеры…
Привет, Зак Аргайл, сначала позвольте мне поблагодарить за эту статью, но я не думаю, что все ваши примеры компаний, которые придерживаются устаревших кодовых баз, написанных в таких фреймворках,..
Быстрый хак: реализация семантики вызова метода в C
C — процедурный язык, минималистичный и лишенный объектной семантики. Вместо этого у вас есть структуры, функции (процедуры) и указатели. Вы можете использовать их для реализации чего-то похожего..
Разоблачение роли «старшего инженера» [Часть 1]
Я только начал работать в Andela в новой должности старшего инженера-программиста, и должен признать, что до сих пор это была одна из моих лучших поездок. В Andela наша миссия состоит в том,..