Вопросы с тегом 'missing-data'

Для вопросов, связанных с отсутствием проблем с данными, которые могут включать в себя специальные структуры данных, алгоритмы, статистические методы, методы моделирования, визуализацию, среди других соображений.
15
ответов

Удалите строки со всеми или некоторыми НС (отсутствующие значения) в data.frame

Я хотел бы удалить строки в этом фрейме данных, которые: a) содержат NA по всем столбцам. Ниже приведен примерный кадр данных. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 ...
задан 01 февр. '11 в 14:52
5
ответов

Удалить значения NA из вектора

У меня есть огромный вектор, который имеет пару значений NA, и я пытаюсь найти максимальное значение в этом векторе (вектор - все числа), но я не могу сделать это из-за значений NA. Как я могу удалить значения NA чтобы я мог вычислить максимум?
задан 10 окт. '11 в 1:08
2
ответов

Как построить случайные леса в R с отсутствующими значениями (NA)?

Я хотел бы соответствовать случайной модели леса, но когда я звоню library(randomForest) cars$speed[1] <- NA # to simulate missing value model <- randomForest(speed ~., data=cars) Я получаю следующую ошибку Error in na.fail.default(list(spe...
задан 03 дек. '11 в 22:44
8
ответов

Элегантный способ сообщения отсутствующих значений в data.frame

Вот небольшой фрагмент кода, который я написал, чтобы сообщать переменные с отсутствующими значениями из фрейма данных. Я пытаюсь придумать более элегантный способ сделать это, который, возможно, возвращает data.frame, но я застрял: for (Var in name...
задан 29 нояб. '11 в 23:23
4
ответов

Удалить строки с пустыми значениями в одном столбце

Я работаю над большим набором данных, с некоторыми строками с NA и другими с пробелами: df <- data.frame(ID = c(1:7), home_pc = c("","CB4 2DT", "NE5 7TH", "BY5 8IB", "DH4 6PB","MP9 7GH","KN4 5GH"), ...
задан 03 февр. '12 в 13:06
3
ответов

В чем разница между <NA> и NA?

У меня есть фактор с именем SMOKE с уровнями "Y" и "N". Отсутствующие значения были заменены на NA (от начального уровня "NULL" ). Однако, когда я рассматриваю этот фактор, я получаю что-то вроде этого: head(SMOKE) N N <NA> Y Y N Levels: Y N ...
задан 27 апр. '13 в 18:24
8
ответов

строка в формате python неиспользуемые именованные аргументы

Скажем, у меня есть: action = '{bond}, {james} {bond}'.format(bond='bond', james='james') этот вывод wil: 'bond, james bond' Далее мы имеем: action = '{bond}, {james} {bond}'.format(bond='bond') это выведет: KeyError: 'james' Есть ли сп...
задан 20 июня '13 в 16:50
3
ответов

Обработка отсутствующих/неполных данных в R - существует ли функция маскировки, но не удаление NA?

Как и следовало ожидать от DSL, предназначенного для анализа данных, R очень хорошо обрабатывает недостающие/неполные данные, например: Многие функции R имеют флаг na.rm, который, когда установлен в значение ИСТИНА, удаляет NAs: >>> v = ...
задан 10 апр. '10 в 15:52
6
ответов

Отсутствующие ценности в обучении машинам scikits

Возможно ли иметь недостающие значения в scikit-learn? Как они должны быть представлены? Я не мог найти документацию об этом.
задан 20 февр. '12 в 20:56
7
ответов

Вставить строки для отсутствующих дат/раз

Я новичок в R, но обратился к нему, чтобы решить проблему с большим набором данных, который я пытаюсь обработать. В настоящее время у меня есть 4 столбца данных (значения Y), установленные против временных интервалов минут (месяц/день/год: мин) (знач...
задан 28 мая '13 в 11:12
1
ответ

Включение отсутствующих значений в таблицу() приводит к R

У меня есть вектор целых чисел от 0 до 5. Я хочу вычислить гистограмму счетчиков. Например: y <- c(0, 0, 1, 3, 4, 4) table(y) # y # 0 1 3 4 # 2 1 1 2 Однако я также хочу, чтобы результаты включали в себя тот факт, что есть нуль 2 и нуль 5, т....
задан 24 окт. '09 в 8:31
2
ответов

Выберите NA в таблице данных в R

Как выбрать все строки с отсутствующим значением в первичном ключе в таблице данных. DT = data.table(x=rep(c("a","b",NA),each=3), y=c(1,3,6), v=1:9) setkey(DT,x) Выбор для определенного значения легко DT["a",] Выбор для отсутствующих значе...
задан 28 сент. '12 в 22:27
2
ответов

Как записать строковый столбец строки данных python, если он имеет отсутствующие значения?

Следующий код не работает. import pandas as pd import numpy as np df=pd.DataFrame(['ONE','Two', np.nan],columns=['x']) xLower = df["x"].map(lambda x: x.lower()) Как мне настроить его, чтобы получить xLower = ['one', 'two', np.nan]? Эффективность ...
задан 07 марта '14 в 11:34
7
ответов

Заменить отсутствующие значения со значением столбца

Я не уверен, как перебирать каждый столбец, чтобы заменить значения NA значком столбца. Когда я пытаюсь заменить один столбец, используя следующее, он работает хорошо. Column1[is.na(Column1)] <- round(mean(Column1, na.rm = TRUE)) Код для циклир...
задан 14 сент. '14 в 19:50
6
ответов

Как обрабатывать несколько видов пропусков в R?

Многие опросы имеют коды для разных видов недостатков. Например, в кодовой книге может указываться: 0-99 Данные -1 Вопрос не задан -5 Не знаю -7 Отказаться от ответа -9 Модуль не задан У Stata есть прекрасное средство для обработки этих множестве...
задан 17 марта '11 в 9:43