Вопросы с тегом 'missing-data'

Для вопросов, связанных с отсутствием проблем с данными, которые могут включать в себя специальные структуры данных, алгоритмы, статистические методы, методы моделирования, визуализацию, среди других соображений.
17

Удалите строки со всеми или некоторыми НС (отсутствующие значения) в data.frame

Я хотел бы удалить строки в этом фрейме данных, которые: a) содержат NA по всем столбцам. Ниже приведен примерный кадр данных. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 ...
01 февр. '11 в 11:52
6

Удалить значения NA из вектора

У меня есть огромный вектор, который имеет пару значений NA, и я пытаюсь найти максимальное значение в этом векторе (вектор - все числа), но я не могу сделать это из-за значений NA. Как я могу удалить значения NA чтобы я мог вычислить максимум?
09 окт. '11 в 22:08
3

Как использовать случайные леса в R с пропущенными значениями?

library(randomForest) rf.model <- randomForest(WIN ~ ., data = learn) Я хотел бы соответствовать модели случайного леса, но я получаю эту ошибку: Error in na.fail.default(list(WIN = c(2L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, : missing values in object...
03 дек. '11 в 19:44
12

Элегантный способ сообщения отсутствующих значений в data.frame

Вот небольшой фрагмент кода, который я написал, чтобы сообщать переменные с отсутствующими значениями из фрейма данных. Я пытаюсь придумать более элегантный способ сделать это, который, возможно, возвращает data.frame, но я застрял: for (Var in name...
29 нояб. '11 в 20:23
8

Как сделать строчный столбец pandas dataframe, если в нем отсутствуют значения?

Следующий код не работает. import pandas as pd import numpy as np df=pd.DataFrame(['ONE','Two', np.nan],columns=['x']) xLower = df["x"].map(lambda x: x.lower()) Как мне настроить его, чтобы получить xLower = ['one', 'two', np.nan]? Эффективность ...
07 мар. '14 в 8:34
5

Удалить строки с пустыми значениями в одном столбце

Я работаю над большим набором данных, с некоторыми строками с NA и другими с пробелами: df <- data.frame(ID = c(1:7), home_pc = c("","CB4 2DT", "NE5 7TH", "BY5 8IB", "DH4 6PB","MP9 7GH","KN4 5GH"), ...
03 февр. '12 в 10:06
9

строка в формате python неиспользуемые именованные аргументы

Скажем, у меня есть: action = '{bond}, {james} {bond}'.format(bond='bond', james='james') этот вывод wil: 'bond, james bond' Далее мы имеем: action = '{bond}, {james} {bond}'.format(bond='bond') это выведет: KeyError: 'james' Есть ли сп...
20 июн. '13 в 13:50
11

Заменить отсутствующие значения со значением столбца

Я не уверен, как перебирать каждый столбец, чтобы заменить значения NA значком столбца. Когда я пытаюсь заменить один столбец, используя следующее, он работает хорошо. Column1[is.na(Column1)] <- round(mean(Column1, na.rm = TRUE)) Код для циклир...
14 сент. '14 в 16:50
9

Вставить строки для отсутствующих дат/раз

Я новичок в R, но обратился к нему, чтобы решить проблему с большим набором данных, который я пытаюсь обработать. В настоящее время у меня есть 4 столбца данных (значения Y), установленные против временных интервалов минут (месяц/день/год: мин) (знач...
28 мая '13 в 8:12
3

В чем разница между <NA> и NA?

У меня есть фактор с именем SMOKE с уровнями "Y" и "N". Отсутствующие значения были заменены на NA (от начального уровня "NULL" ). Однако, когда я рассматриваю этот фактор, я получаю что-то вроде этого: head(SMOKE) N N <NA> Y Y N Levels: Y N ...
27 апр. '13 в 15:24
2

Python, Pandas: возвращать только те строки, у которых отсутствуют значения

Во время работы в Pandas в Python... Я работаю с набором данных, который содержит некоторые отсутствующие значения, и я хотел бы вернуть DataFrame, который содержит только те строки, у которых отсутствуют данные. Есть ли хороший способ сделать это?...
25 мая '15 в 23:03
7

Отсутствующие ценности в обучении машинам scikits

Возможно ли иметь недостающие значения в scikit-learn? Как они должны быть представлены? Я не мог найти документацию об этом.
20 февр. '12 в 17:56
3

Обработка отсутствующих/неполных данных в R - существует ли функция маскировки, но не удаление NA?

Как и следовало ожидать от DSL, предназначенного для анализа данных, R очень хорошо обрабатывает недостающие/неполные данные, например: Многие функции R имеют флаг na.rm, который, когда установлен в значение ИСТИНА, удаляет NAs: >>> v = ...
10 апр. '10 в 12:52
1

Включение отсутствующих значений в таблицу() приводит к R

У меня есть вектор целых чисел от 0 до 5. Я хочу вычислить гистограмму счетчиков. Например: y <- c(0, 0, 1, 3, 4, 4) table(y) # y # 0 1 3 4 # 2 1 1 2 Однако я также хочу, чтобы результаты включали в себя тот факт, что есть нуль 2 и нуль 5, т....
24 окт. '09 в 5:31
5

Как получить итоговое количество отсутствующих /NaN данных по столбцу в 'pandas'?

В R я могу быстро увидеть количество отсутствующих данных с помощью команды summary, но эквивалентный pandas метод DataFrame describe не сообщает эти значения. Я собираюсь сделать что-то вроде len(mydata.index) - mydata.count() чтобы вычислить ...
07 мар. '14 в 18:08