Вопросы с тегом 'nlp'

Обработка естественного языка (NLP) - это подполе искусственного интеллекта, которое включает в себя преобразование или извлечение полезной информации из данных естественного языка. Методы включают в себя методы машинного обучения и основанные на правилах.
17

Какую статистику должен знать программист (или компьютерный ученый)?

Я программист с приличным опытом в математике и информатике. Я изучал вычислимость, теорию графов, линейную алгебру, абстрактную алгебру, алгоритмы и небольшую вероятность и статистику (через несколько классов CS) на уровне бакалавриата. Я чувствую,...
11 янв. '10 в 4:21
18

Как Google "Вы имели в виду?" Алгоритм работает?

Я разрабатываю внутренний веб-сайт для инструмента управления портфелем. Существует много текстовых данных, названий компаний и т.д. На меня действительно впечатлили способность поисковых систем очень быстро реагировать на запросы с помощью "Вы имели...
20 нояб. '08 в 23:34
8

Как вычислить сходство между двумя текстовыми документами?

Я смотрю на работу над проектом НЛП, на любом языке программирования (хотя Python будет моим предпочтением). Я хочу взять два документа и определить, насколько они похожи.
17 янв. '12 в 15:51
10

Java Stanford NLP: Часть лейблов речи?

Стэнфордская НЛП, demo'd здесь, дает результат следующим образом: Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. Что означают теги Part of Speech? Я не могу найти официальный список. Это Стэнфордская собственная система, или они исполь...
02 дек. '09 в 14:30
6

Как Apple находит даты, время и адреса в электронных письмах?

В почтовом клиенте iOS, когда электронное письмо содержит дату, время или местоположение, текст становится гиперссылкой, и можно создать встречу или посмотреть карту, просто нажав ссылку. Он не только работает для электронной почты на английском язык...
15 февр. '12 в 14:12
10

Как избавиться от пунктуации с помощью токенизатора NLTK?

Я только начинаю использовать NLTK, и я не совсем понимаю, как получить список слов из текста. Если я использую nltk.word_tokenize(), я получаю список слов и знаков препинания. Мне нужны только слова. Как я могу избавиться от пунктуации? Кроме того,...
21 мар. '13 в 12:22
12

Обнаружение слогов словом

Мне нужно найти довольно эффективный способ обнаружения слогов в слове. Например. Невидимый → in-vi-sib-le Существуют правила силлабификации, которые можно использовать: V резюме VC CVC ККТ CCCV CVCC *, где V - гласный, а C - согласный. Например,...
01 янв. '09 в 17:08
17

Как вы реализуете "Вы имели в виду"?

Возможный дубликат: Как Google "Вы имели в виду?" Алгоритм работает? Предположим, что у вас есть поисковая система уже на вашем сайте. Как вы можете реализовать "Имел ли в виду: <spell_checked_word>", как Google, в некоторых поисковых...
03 сент. '08 в 10:36
8

Какова истинная разница между леммитацией и вытеканием?

Когда я использую каждый? Также... является ли ЛИМКТ-зависимость ЛДПЛ зависимой от частей речи? Не было бы более точным, если бы это было?
24 нояб. '09 в 0:48
3

Как обучить Стэнфордский Парсер с помощью Genia Corpus?

У меня возникли проблемы с созданием новой модели для Stanford Parser. Я также загрузил последнюю версию из Стэнфорда: http://nlp.stanford.edu/software/lex-parser.shtml И вот, Genia Corpus в двух форматах, xml и ptb (Penn Treebank). Standford Pars...
01 июн. '12 в 13:13
17

Как мне выполнить слово Stemming или Lemmatization?

Я пробовал PorterStemmer и Snowball, но оба они не работают над всеми словами, пропуская некоторые очень распространенные. Мои тестовые слова: " кошки, бегущие как cactus cactus cactus сообщества сообщества cacti", и оба получают меньше половины пра...
21 апр. '09 в 10:07
2

Java или Python для обработки естественного языка

Я хотел бы знать, какой язык программирования лучше подходит для обработки естественного языка. Java или Python? Я нашел много вопросов и ответов относительно этого. Но я все еще теряю выбор того, какой из них использовать. И я хочу знать, какую биб...
07 апр. '14 в 5:08
23

Как правильно задать слово "a" и "an"?

У меня есть приложение .NET, где, учитывая существительное, я хочу, чтобы он правильно префикс этого слова с помощью "a" или "an". Как мне это сделать? Прежде чем вы подумаете, что ответ состоит в том, чтобы просто проверить, является ли первая букв...
17 авг. '09 в 14:34
19

Стэнфордский Парсер и НЛТК

Можно ли использовать Stanford Parser в NLTK? (Я не говорю о Стэнфордском ПОС.)
14 дек. '12 в 17:12
12

Анализ настроений для Twitter в Python

Я ищу реализацию с открытым исходным кодом, предпочтительно на python, Textual Sentiment Analysis (http://en.wikipedia.org/wiki/Sentiment_analysis). Кто-нибудь знаком с такой версией с открытым исходным кодом, которую я могу использовать? Я пишу п...
21 февр. '09 в 21:20