telegram
Александр Иванов
11 августа 2021
Распознавание

Словарь терминов и определений искусственного интеллекта

Узнайте больше о компьютерном зрении и искусственном интеллекте из нашего краткого перечня определений.

Распознавание действий: применение компьютерного зрения, которое стремится определить, когда человек выполняет действие, например, бежит, спит или падает.

AI API : интерфейс прикладного программирования (API), позволяющий пользователям получать доступ к инструментам и функциям искусственного интеллекта. Предлагая сторонние услуги искусственного интеллекта, AI API избавляют разработчиков от необходимости создавать собственный искусственный интеллект.

Компьютер с ИИ : любой компьютер, который может выполнять вычисления для искусственного интеллекта и машинного обучения, т. е. выполнять обучение ИИ или запускать модели. Благодаря последним технологическим достижениям даже скромное аппаратное обеспечение потребительского уровня теперь может запускать модели искусственного интеллекта, оснащенным мощным процессором или графическим процессором.

Модель ИИ : результат обучения алгоритма ИИ с учетом входных данных и настроек (известных как «гиперпараметры»). Модель ИИ — это очищенное представление, которое пытается инкапсулировать все, чему алгоритм ИИ научился в процессе обучения. Модели можно совместно использовать и повторно использовать в новых данных для использования в реальных условиях.

Платформа искусственного интеллекта : программная библиотека или платформа для создания, развертывания и управления приложениями, использующими искусственный интеллект. Платформы ИИ менее статичны и более обширны, чем API ИИ: в то время как API ИИ возвращают результаты сторонней предварительно обученной модели, платформы ИИ позволяют пользователям создавать свои собственные модели ИИ для различных целей.

Обучение ИИ : процесс обучения одной или нескольких моделей ИИ. В процессе обучения модели ИИ со временем «учатся», просматривая все больше и больше входных данных. Сделав прогноз относительно данного ввода, модель ИИ определяет, был ли этот прогноз правильным; если он был неправильным, он корректирует свои параметры, чтобы учесть ошибку.

Алгоритм: Четко определенная пошаговая процедура, которую может реализовать компьютер. Алгоритмы должны в конечном итоге завершаться и использоваться для выполнения конкретной задачи или предоставления ответа на решаемую бизнес-задачу.

Аннотация: Процесс маркировки/разметки входных данных при подготовке к обучению ИИ. В компьютерном зрении входные изображения и видео должны быть аннотированы в соответствии с задачей, которую должна выполнять модель. Например, если вы хотите, чтобы модель выполняла выделение по контуру (сегментацию изображения), аннотации должны включать расположение и форму каждого объекта на изображении.

Обнаружение аномалий : Подобласть ИИ, машинного обучения и анализа данных, которая направлена на выявление отклонений или выбросов в заданном наборе данных. Обнаружение аномалий применимо в самых разных отраслях и вариантах использования: например, оно может помочь обнаружить случаи банковского мошенничества или дефекты производственного оборудования.

Искусственный интеллект (ИИ) : область компьютерных наук, которая стремится наделить машины интеллектом, обычно путем имитации человеческого мышления и действий. ИИ позволяет компьютерам учиться на собственном опыте и приспосабливаться к невидимым входным данным.

Искусственный интеллект вещей (AIoT) : пересечение искусственного интеллекта с Интернетом вещей: обширная взаимосвязанная сеть устройств и датчиков, которые общаются и обмениваются информацией через Интернет. Данные, собранные устройствами IoT, затем обрабатываются моделями ИИ. Общие варианты использования AIoT включают носимые технологии и устройства для умного дома.

Искусственная нейронная сеть (ИНС). Также называемая «нейронной сетью», модель машинного обучения, состоящая из множества взаимосвязанных искусственных «нейронов». Эти нейроны обмениваются информацией, примерно имитируя человеческий мозг. ИНС являются основой глубокого обучения, подобласти машинного обучения.

Обратное распространение: основной метод обучения ИНС. При обратном распространении веса связей между нейронами изменяются с помощью градиентного спуска, чтобы сеть давала результат, более близкий к ожидаемому.

Байесовская сеть: Вероятностная модель в виде графика, который определяет условную вероятность различных событий (например, вероятность того, что событие А произойдет, при условии, что событие В произойдет или не произойдет).

Большие данные: использование наборов данных, которые слишком велики и/или сложны для анализа людьми или традиционными методами обработки данных. Большие данные могут создавать проблемы с точки зрения скорости (т. е. скорости, с которой они поступают) или достоверности (т. е. поддержания высокого качества данных).

Чат-бот: компьютерная программа, которая использует методы обработки естественного языка для ведения реалистичных разговоров с людьми. Чат-боты часто используются в таких областях, как поддержка клиентов (например, ответы на простые вопросы или обработка возвратов товаров).

Компьютерное зрение : Подобласть компьютерных наук, искусственного интеллекта и машинного обучения, которая стремится дать компьютерам быстрое и высокоуровневое понимание изображений и видео, «видя» их так же, как люди. В последние годы компьютерное зрение добилось больших успехов в точности и скорости благодаря глубокому обучению и нейронным сетям.

Платформа компьютерного зрения : ИТ-решение для создания и развертывания приложений компьютерного зрения, объединяющее среду разработки программного обеспечения с набором связанных ресурсов компьютерного зрения.

Решение для компьютерного зрения : инструмент или платформа, которая помогает пользователям интегрировать компьютерное зрение в свои рабочие процессы, даже не обладая глубокими знаниями в области компьютерного зрения или искусственного интеллекта. Благодаря широкому спектру приложений для компьютерного зрения, от здравоохранения и розничной торговли до производства и безопасности, предприятия всех размеров и отраслей все чаще внедряют подобные решения.

Сверточная нейронная сеть (CNN): особый тип нейронной сети, который использует математическую операцию, известную как «свертка», для объединения входных данных (например, соседних пикселей в изображении). CNN превосходно работают с многомерными входными данными, такими как изображения и видео.

Аугментации: метод увеличения размера ваших наборов данных путем внесения небольших изменений в существующие изображения в наборе данных. Например, вы можете вращать, переворачивать, масштабировать, обрезать или сдвигать изображение несколькими способами, чтобы создать десятки дополненных изображений. Включение дополненных данных может помочь модели научиться лучше обобщать, а не переобучать, чтобы распознавать сами изображения.

Сбор данных: процесс накопления больших объемов информации для использования при обучении модели ИИ. Данные можно собирать из собственных источников (например, ваших собственных видеороликов) или из общедоступных наборов. После сбора данные должны быть аннотированы или помечены для использования в обучении ИИ.

Интеллектуальный анализ данных: использование автоматизированных методов для выявления скрытых закономерностей и идей в наборе данных и создания более точных предсказаний и прогнозов на основе данных. Интеллектуальный анализ данных широко используется в таких областях, как маркетинг, финансы, розничная торговля и наука.

Глубокое обучение: Подобласть искусственного интеллекта и машинного обучения, в которой используются нейронные сети с несколькими «скрытыми» (глубокими) слоями. Благодаря как алгоритмическим улучшениям, так и технологическим достижениям, в последние годы глубокое обучение успешно используется для обучения моделей ИИ, которые могут выполнять множество сложных задач, подобных человеческим, — от распознавания речи до идентификации содержимого изображения.

Обнаружение дефектов: Подобласть компьютерного зрения, которая направлена на выявление дефектов, ошибок, аномалий и проблем с продуктами или оборудованием.

Edge AI : использование алгоритмов искусственного интеллекта и машинного обучения, работающих на периферийных устройствах, для обработки данных на локальном оборудовании, а не для их загрузки в облако. Возможно, самым большим преимуществом Edge AI является более высокая скорость (поскольку данные не нужно отправлять в облако и из облака туда и обратно), что позволяет принимать решения в режиме реального времени.

Ансамбльное обучение: использование прогнозов нескольких моделей ИИ, обученных на одних и тех же входных данных (или выборках одного и того же входного сигнала), для уменьшения ошибок и повышения точности. Из-за естественной изменчивости на этапе обучения разные модели могут возвращать разные результаты при одних и тех же данных. Ансамблевое обучение объединяет прогнозы всех этих моделей (например, путем получения большинства голосов) с целью повышения производительности.

Аутентификация по лицу: Подзадача распознавания лиц, которая пытается подтвердить личность человека, обычно в целях безопасности. Аутентификация по лицу часто выполняется на периферийных устройствах, которые достаточно мощны, чтобы распознать объект почти мгновенно и с высокой степенью точности.

Распознавание лиц: использование человеческих лиц в качестве биометрической характеристики путем изучения различных черт лица (например, расстояние и расположение глаз, носа, рта и скул). Распознавание лиц используется как для аутентификации лиц (идентификация отдельных людей с их согласия), так и в системах видеонаблюдения, которые фиксируют изображения людей в общественных местах.

Генеративно-состязательная сеть (GAN): Тип нейронной сети, которая пытается учиться посредством конкуренции. Одна сеть, «генератор», пытается создать реалистичные имитации обучающих данных (например, фотографии человеческих лиц). Другая сеть, «дискриминатор», пытается отделить настоящие примеры от поддельных.

Генетический алгоритм: класс алгоритмов, вдохновленных эволюционным феноменом естественного отбора. Генетические алгоритмы начинаются с «пула» возможных решений, которые со временем развиваются и мутируют, пока не достигнут точки остановки.

GPU: сокращение от «графический процессор», специализированное аппаратное устройство, используемое в компьютерах, смартфонах и встроенных системах, изначально созданное для рендеринга компьютерной графики в реальном времени. Однако способность графических процессоров эффективно обрабатывать множество входных данных одновременно сделала их полезными для широкого круга приложений, в том числе для обучения моделей ИИ.

Хэш: результат математической функции, известной как «хэш-функция», которая преобразует произвольные данные в уникальный (или почти уникальный) числовой вывод. Например, при аутентификации по лицу сложная хеш-функция кодирует идентифицирующие характеристики лица пользователя и возвращает числовой результат. Когда пользователь пытается получить доступ к системе, его лицо преобразуется и сравнивается с существующими хэшами для проверки личности.

Обогащение изображения: использование искусственного интеллекта и машинного обучения для автоматического «обогащения» визуальных данных, таких как изображения и видео, путем добавления метаданных (например, автора изображения, даты создания или содержания). Например, в медиа-индустрии обогащение изображений используется для быстрой и точной маркировки списков интернет-магазинов или новых фотографий агентств.

Контроль качества изображения: использование искусственного интеллекта и машинного обучения для автоматического контроля качества визуальных данных, таких как изображения и видео. Например, инструменты контроля качества изображения могут обнаруживать дефекты изображения, такие как размытость, нагота, дипфейки и запрещенный контент, и устранять проблему или удалять изображение из набора данных.

Распознавание изображений: Подобласть ИИ и компьютерного зрения, которая стремится распознавать содержимое изображения, описывая его на высоком уровне. Например, обученная модель распознавания изображений может различать изображения собак и изображения кошек. Распознавание изображений отличается от сегментации изображения, которая направлена на разделение изображения на несколько частей (например, фон и различные объекты).

Сегментация изображения: Подобласть компьютерного зрения, которая стремится разделить изображение на непрерывные части, связывая каждый пиксель с определенной категорией, такой как фон или объект переднего плана.

Инференс: использование обученной модели машинного обучения для прогнозирования ранее невиданного набора данных. Другими словами, модель выводит содержимое набора данных, используя то, что она узнала из обучающего набора.

Ответ JSON: ответ на запрос API, в котором используется популярный и упрощенный формат файла JSON (JavaScript Open Notation) . Ответ JSON состоит из массива верхнего уровня, который содержит одну или несколько пар ключ-значение (например, { «имя»: «Джон Смит», «возраст»: 30}).

Маркировка: процесс присвоения метки, которая обеспечивает правильный контекст для каждого ввода в наборе обучающих данных или «ответ», который вы хотите, чтобы модель ИИ возвращала во время обучения. В компьютерном зрении есть два типа маркировки: аннотация и тегирование. Маркировка может выполняться собственными силами или с помощью аутсорсинговых или краудсорсинговых услуг.

Обнаружение живости (антиспуфинг) : функция безопасности для систем аутентификации по лицу для проверки того, что данное изображение или видео представляет собой живого, подлинного человека, а не является попыткой мошеннического обхода системы (например, путем ношения маски, похожей на человека, или путем отображения спящего лица). лицо человека). Обнаружение живости необходимо для защиты от злоумышленников.

Машинное обучение : Подобласть ИИ и компьютерных наук, изучающая алгоритмы, которые могут со временем улучшаться, приобретая больше опыта или просматривая больше данных. Машинное обучение включает как обучение с учителем (при котором алгоритм получает ожидаемые результаты или метки), так и обучение без учителя (при котором алгоритм должен находить закономерности в неразмеченных данных).

Машинный перевод: Использование компьютеров для автоматического перевода текста с одного естественного (человеческого) языка на другой без помощи переводчика-человека.

Машинное зрение: Подобласть искусственного интеллекта и компьютерного зрения, объединяющая аппаратное и программное обеспечение, позволяющая машинам «видеть» на таком же высоком уровне, как и люди. Машинное зрение отличается от компьютерного зрения: система машинного зрения состоит как из механического «тела», которое захватывает изображения и видео, так и из программного обеспечения компьютерного зрения, которое интерпретирует эти входные данные.

Метаданные: данные, которые описывают и предоставляют информацию о других данных. Для визуальных данных, таких как изображения и видео, метаданные состоят из трех категорий: технические (например, тип камеры и настройки), описательные (например, автор, дата создания, название, содержание и ключевые слова) и административные (например, контактная информация и Авторские права).

Отслеживание движения: область компьютерного зрения, целью которой является отслеживание движения человека или объекта в нескольких кадрах видео.

Обработка естественного языка (NLP): Подобласть компьютерных наук и искусственного интеллекта, целью которой является заставить компьютеры понимать, интерпретировать и генерировать человеческие языки.

Нейронная сеть: алгоритм искусственного интеллекта и машинного обучения, который стремится имитировать высокоуровневую структуру человеческого мозга. Нейронные сети имеют множество взаимосвязанных искусственных «нейронов», расположенных в несколько слоев, каждый из которых хранит сигнал, который он может передавать другим нейронам. Использование более крупных нейронных сетей с множеством скрытых слоев известно как глубокое обучение.

ИИ без кода: использование платформы без кода для создания моделей ИИ без необходимости написания строк компьютерного кода (или вообще знакомства с компьютерным программированием).

Распознавание объектов: подобласть компьютерного зрения, искусственного интеллекта и машинного обучения, целью которой является распознавание и идентификация наиболее заметных объектов (то есть людей или вещей) на цифровом изображении или видео.

Оптическое распознавание символов (OCR): технология, которая распознает рукописный или печатный текст и преобразует его в цифровые символы.

Переобучение: проблема производительности с моделями машинного обучения, в которых модель учится слишком точно подгонять обучающие данные, включая чрезмерную детализацию и шум. Это приводит к тому, что модель плохо работает с неизвестными тестовыми данными. Поскольку переобучение часто вызывается недостатком данных для обучения, такие методы, как увеличение данных и создание синтетических данных, могут помочь смягчить его.

Распознавание образов: использование методов машинного обучения для автоматического выявления закономерностей (и аномалий) в наборе входных данных.

Предварительно обученная модель: модель ИИ, которая уже была обучена на наборе входных обучающих данных. При наличии входных данных предварительно обученная модель может быстро вернуть свой прогноз на основе этих входных данных без необходимости повторного обучения модели. Предварительно обученные модели также можно использовать для трансферного обучения, т. е. применения знаний к другой, но похожей задаче (например, от распознавания производителей автомобилей до производителей грузовиков).

Рекуррентная нейронная сеть (RNN): особый тип нейронной сети, который использует выходные данные предыдущего шага в качестве входных данных для текущего шага. RNN лучше всего подходят для последовательных и временных данных, таких как текст и речь.

Обучение с подкреплением: Подобласть ИИ и машинного обучения, которая учит модель ИИ, используя метод проб и ошибок, тому, как вести себя в сложной среде, чтобы максимизировать ее вознаграждение.

Роботизированная автоматизация процессов (RPA): Подобласть автоматизации бизнес-процессов, в которой используются программные «роботы» для автоматизации повторяющихся задач, выполняемых вручную.

Робототехника: междисциплинарная область, объединяющая инженерию и информатику, целью которой является создание интеллектуальных машин, известных как «роботы», которые имеют тела и могут действовать в физическом мире.

Сегментация: подобласть ИИ и компьютерного зрения, которая стремится разделить изображение или видео на несколько частей (например, фон и разные объекты). Например, изображение толпы людей может быть разделено на очертания каждого отдельного человека, а также на фон изображения. Сегментация изображения широко используется в таких приложениях, как здравоохранение (например, идентификация раковых клеток на медицинском изображении).

Обнаружение тональности: Подобласть ИИ и компьютерного зрения, которая стремится понять тон данного текста. Это может включать в себя определение того, имеет ли текст положительное, отрицательное или нейтральное мнение или содержит ли он определенное эмоциональное состояние (например, «грустный», «сердитый» или «счастливый»).

Структурированные данные : данные, соответствующие известной предопределенной схеме, упрощающие запросы и анализ. Примеры структурированных данных включают записи учащихся (с такими полями, как имя, год обучения, средний балл и т. д.) и ежедневные цены на акции.

Контролируемое обучение: подполе машинного обучения, в котором в процессе обучения используются как входные данные, так и ожидаемые выходные метки. Таким образом, компьютер может легко определить и исправить свои ошибки.

Синтетические данные : реалистичные, но сгенерированные компьютером данные изображения, которые можно использовать для увеличения размера ваших наборов данных во время обучения ИИ. Используя 3D-модель и связанную с ней текстуру, можно создавать синтетические данные (и соответствующие аннотации или ограничивающие рамки) с широким спектром поз, точек обзора, фона и условий освещения.синтетические данные для ИИ

Обучение без учителя: Подобласть машинного обучения, которая предоставляет только входные данные, но не ожидаемый результат в процессе обучения. Это требует от компьютера выявления скрытых шаблонов и построения собственной модели данных.

Видеоаналитика: использование искусственного интеллекта и компьютерного зрения для автоматического анализа содержания видео. Это может включать в себя распознавание лиц, обнаружение движения и/или обнаружение объектов. Видеоаналитика широко используется в таких отраслях, как безопасность, строительство, розничная торговля и здравоохранение, для приложений от предотвращения потерь до здоровья и безопасности.

Хотите узнать больше об услугах компьютерного зрения? Или остались термины, которые хотели бы прояснить для себя? Свяжитесь с нами для консультации.

Расскажите нам о своём проекте

Отправляя это, вы соглашаетесь с нашей политикой конфиденциальности