Вопросы с тегом 'language-detection'

Определение языка или идентификация языка - это задача идентификации языка (ов) в фрагменте текста.
8 отв.

Какие различия, если таковые имеются, между С++ 03 и С++ 11 могут быть обнаружены во время выполнения?

Можно написать функцию, которая при компиляции с компилятором C вернет 0 и при компиляции с компилятором С++ вернет 1 (тривиальная процедура с помощью #ifdef __cplusplus не интересен). Например: int isCPP() { return sizeof(char) == sizeof 'c';...
24 июня '11 в 23:05
16 отв.

Обнаружение языка программирования из фрагмента

Каким будет лучший способ определить, какой язык программирования используется во фрагменте кода?
24 янв. '09 в 2:16
7 отв.

Как определить язык введенного пользователем текста?

Я имею дело с приложением, которое принимает ввод пользователя на разных языках (в настоящее время 3 фиксированных языка). Требование состоит в том, чтобы пользователи могли вводить текст и не беспокоиться, чтобы выбрать язык через предоставленный фл...
12 июля '10 в 13:07
15 отв.

Обнаружение языка из строки в PHP

В PHP существует ли способ определить язык строки? Предположим, что строка находится в формате UTF-8.
18 сент. '09 в 1:06
9 отв.

Как определить язык строки?

Какой лучший способ определить язык строки?
28 июля '09 в 11:47
7 отв.

Обнаружить текст текста

Есть ли библиотека С#, которая может определять язык определенного фрагмента текста? то есть для входного текста "This is a sentence", он должен определять язык как "English". Или для "Esto es una sentencia" он должен определить язык как "Spanish". ...
23 сент. '09 в 10:00
10 отв.

PHP: Как определить, является ли входная строка арабской

Есть ли способ определить язык данных, вводимых через поле ввода?
22 авг. '10 в 14:53
5 отв.

Как определить язык текста?

У меня есть форма, которая позволяет пользователям вводить текстовые фрагменты. Итак, как определить язык введенного текста? В частности, эти языки: Арабский: هذه هي بعض النصوص العربية Китайский: 这 是 一些 阿拉伯 文字 Японский: こ れ は, い く つ か の ア ラ ビ ア 語...
02 мая '10 в 9:49
7 отв.

Как определить язык

Есть ли какие-нибудь хорошие двигатели с открытым исходным кодом для определения того, на каком языке находится текст, возможно, с метрикой вероятности? Один, который я могу запустить локально и не запрашивает Google или Bing? Я хотел бы определить я...
04 июля '10 в 1:04
8 отв.

Как определить язык данного текста

В моем приложении Rails 3 пользователи могут писать сообщения на форуме. Я хотел бы определить, какой язык для данного сообщения. Меня интересуют английский, русский и иврит. Есть ли встроенная библиотека в Ruby/Rails для такой задачи? Если нет, любы...
05 мая '11 в 15:33
5 отв.

Определение того, является ли текст английским (навалом)

Я ищу простой способ определить, является ли короткий отрывок текста, несколько предложений, английским или нет. Мне кажется, что эта проблема намного проще, чем попытка обнаружить произвольный язык. Есть ли там программное обеспечение, которое может...
05 янв. '11 в 17:20
6 отв.

Обнаружение языка с данными в PostgreSQL

У меня есть таблица в PostgreSQL, где столбец - это текст. Мне нужна библиотека или инструмент, который может идентифицировать язык каждого текста для целей тестирования. Нет необходимости в PostgreSQL-коде, потому что у меня возникают проблемы с ус...
21 янв. '12 в 23:13
2 отв.

Автоматический выбор страны и языка для пользователя в Java Servlet

Мне нужно автоматически определять страну и язык пользователя в Java Servlet с использованием данных запроса (IP-адрес, информация обозревателя и т.д.). Возможно ли определить эти настройки для большинства пользователей (~ 90%)?
13 мая '11 в 10:28
1 отв.

Добавление профиля языка в Apache Tika

Может понравиться любому, кто сумел это объяснить, как это сделать: -) Нужно ли мне получать n-граммовые файлы для языка, который мне нужно добавить? Разве это вопрос создания tika.language.override.properties, добавить некоторые другие коды lang ...
03 июня '11 в 16:16
6 отв.

Тестирование японских/китайских символов в строке

У меня есть программа, которая читает кучу текста и анализирует его. Текст может быть на любом языке, но мне нужно проверить, чтобы японский и китайский специально анализировали их по-другому. Я прочитал, что я могу проверить каждый символ на этом н...
24 апр. '09 в 19:34