Вопросы с тегом 'dataframe'

Кадр данных представляет собой структуру табличных данных. Обычно он содержит данные, в которых строки являются наблюдениями, а столбцы являются переменными различных типов. Хотя "фрейм данных" или "dataframe" - это термин, используемый для этой концепции на нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), "table" - это термин, используемый в MATLAB и SQL.
16
ответов

Как отсортировать данные по столбцам (столбцам)?

Я хочу сортировать data.frame по нескольким столбцам. Например, с приведенным ниже номером data.frame, я хотел бы отсортировать по столбцу z (убыв), затем по столбцу b (по возрастанию): dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), ...
задан 19 авг. '09 в 0:33
13
ответов

Выберите строки из DataFrame на основе значений в столбце в pandas

Как выбрать строки из DataFrame на основе значений в некотором столбце в pandas? В SQL я бы использовал: select * from table where colume_name = some_value. Я попытался посмотреть документацию pandas, но не сразу нашел ответ.
задан 12 июня '13 в 20:42
13
ответов

Как объединить (объединить) кадры данных (внутренний, внешний, левый, правый)?

Учитывая два кадра данных: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaste...
задан 19 авг. '09 в 16:18
15
ответов

Как перебирать строки в DataFrame в Pandas?

У меня есть DataFrame от панд: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Выход: c1 c2 0 10 100 1 11 110 2 12 120 Теперь я хочу перебрать строки этого кадра....
задан 10 мая '13 в 10:04
16
ответов

Удалить столбец из pandas DataFrame, используя del df.column_name

При удалении столбца в DataFrame я использую: del df['column_name'] И это прекрасно работает. Почему я не могу использовать следующее? del df.column_name Поскольку вы можете получить доступ к столбцу/Серии как df.column_name, я ожидаю, что это с...
задан 16 нояб. '12 в 9:26
21
ответ

Переименование столбцов в pandas

У меня есть таблица данных, использующая pandas и метки столбцов, которые мне нужно изменить, чтобы заменить исходные метки столбцов. Я хотел бы изменить имена столбцов в таблице данных A, где имена исходных столбцов: ['$a', '$b', '$c', '$d', '$e...
задан 05 июля '12 в 17:21
21
ответ

Удаление столбцов фрейма данных по имени

У меня есть несколько столбцов, которые я хотел бы удалить из фрейма данных. Я знаю, что мы можем удалить их индивидуально, используя что-то вроде: df$x <- NULL Но я надеялся сделать это с меньшим количеством команд. Кроме того, я знаю, что я ...
задан 05 янв. '11 в 17:34
21
ответ

Добавление нового столбца в существующий DataFrame в Python pandas

У меня есть следующий индексированный DataFrame с именованными столбцами, а строки - не непрерывными числами: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 ...
задан 23 сент. '12 в 22:00
15
ответов

Удалите строки со всеми или некоторыми НС (отсутствующие значения) в data.frame

Я хотел бы удалить строки в этом фрейме данных, которые: a) содержат NA по всем столбцам. Ниже приведен примерный кадр данных. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 ...
задан 01 февр. '11 в 14:52
15
ответов

Выбор нескольких столбцов в кадре данных pandas

У меня есть данные в разных столбцах, но я не знаю, как их извлечь, чтобы сохранить их в другой переменной. index a b c 1 2 3 4 2 3 4 5 Как выбрать 'a', 'b' и сохранить его в df1? Я старался df1 = df['a':'b'] df1 = df.ix[:,...
задан 02 июля '12 в 0:03
16
ответов

Как заменить значения NA нулями в R-кадре данных?

У меня есть фрейм данных, и некоторые столбцы имеют значения NA. Как заменить эти значения NA на нули?
задан 17 нояб. '11 в 6:45
12
ответов

Как получить количество строк в Pandas данных?

Я пытаюсь получить количество строк в df с помощью Pandas, и вот мой код. Способ 1: total_rows = df.count print total_rows +1 Способ 2: total_rows = df['First_columnn_label'].count print total_rows +1 Оба фрагмента кода дают мне эту ошибку: О...
задан 11 апр. '13 в 11:14
10
ответов

Как удалить строки из Pandas DataFrame, значение которого в определенных столбцах равно NaN

У меня есть DataFrame: >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN...
задан 16 нояб. '12 в 12:17
8
ответов

Быстрое чтение очень больших таблиц в качестве данных

У меня очень большие таблицы (30 миллионов строк), которые я бы хотел загрузить в качестве кадровых фреймов в R. read.table() имеет множество удобных функций, но похоже, что в реализации есть много логики, которая замедлить работу. В моем случае я п...
задан 13 нояб. '09 в 10:53
11
ответов

Разница между скобками [] и двойной скобкой [[]] для доступа к элементам списка или кадра данных

R предоставляет два разных метода для доступа к элементам списка или оператора data.frame - [] и [[]]. В чем разница между этими двумя? В каких ситуациях я должен использовать один над другим?
задан 23 июля '09 в 6:33