Вопросы с тегом 'dataframe'

Кадр данных представляет собой структуру табличных данных. Обычно он содержит данные, в которых строки являются наблюдениями, а столбцы являются переменными различных типов. Хотя "фрейм данных" или "dataframe" - это термин, используемый для этой концепции на нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), "table" - это термин, используемый в MATLAB и SQL.
30
ответов

Переименование столбцов в pandas

У меня есть DataFrame, использующий панды и метки столбцов, которые мне нужно отредактировать, чтобы заменить оригинальные метки столбцов. Я хотел бы изменить имена столбцов в DataFrame A где исходные имена столбцов: ['$a', '$b', '$c', '$d', '$e'] ...
задан 05 июля '12 в 17:21
19
ответов

Как отсортировать данные по нескольким столбцам?

Я хочу сортировать data.frame по нескольким столбцам. Например, с приведенным ниже номером data.frame, я хотел бы отсортировать по столбцу z (убыв), затем по столбцу b (по возрастанию): dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), ...
задан 19 авг. '09 в 0:33
13
ответов

Выберите строки из DataFrame на основе значений в столбце в pandas

Как выбрать строки из DataFrame на основе значений в некотором столбце в pandas? В SQL я бы использовал: select * from table where colume_name = some_value. Я попытался посмотреть документацию pandas, но не сразу нашел ответ.
задан 12 июня '13 в 20:42
13
ответов

Как объединить (объединить) кадры данных (внутренний, внешний, левый, правый)?

Учитывая два кадра данных: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaste...
задан 19 авг. '09 в 16:18
16
ответов

Как перебирать строки в DataFrame в Pandas?

У меня есть DataFrame от панд: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Выход: c1 c2 0 10 100 1 11 110 2 12 120 Теперь я хочу перебрать строки этого кадра....
задан 10 мая '13 в 10:04
16
ответов

Удалить столбец из панды DataFrame

При удалении столбца в DataFrame я использую: del df['column_name'] И это прекрасно работает. Почему я не могу использовать следующее? del df.column_name Поскольку вы можете получить доступ к столбцу/Серии как df.column_name, я ожидаю, что это с...
задан 16 нояб. '12 в 9:26
21
ответ

Удаление столбцов фрейма данных по имени

У меня есть несколько столбцов, которые я хотел бы удалить из фрейма данных. Я знаю, что мы можем удалить их индивидуально, используя что-то вроде: df$x <- NULL Но я надеялся сделать это с меньшим количеством команд. Кроме того, я знаю, что я ...
задан 05 янв. '11 в 17:34
22
ответов

Добавление нового столбца в существующий DataFrame в Python pandas

У меня есть следующий индексированный DataFrame с именованными столбцами, а строки - не непрерывными числами: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 ...
задан 23 сент. '12 в 22:00
15
ответов

Удалите строки со всеми или некоторыми НС (отсутствующие значения) в data.frame

Я хотел бы удалить строки в этом фрейме данных, которые: a) содержат NA по всем столбцам. Ниже приведен примерный кадр данных. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 ...
задан 01 февр. '11 в 14:52
16
ответов

Выбор нескольких столбцов в кадре данных pandas

У меня есть данные в разных столбцах, но я не знаю, как их извлечь, чтобы сохранить их в другой переменной. index a b c 1 2 3 4 2 3 4 5 Как выбрать 'a', 'b' и сохранить его в df1? Я старался df1 = df['a':'b'] df1 = df.ix[:,...
задан 02 июля '12 в 0:03
17
ответов

Как заменить значения NA нулями в R-кадре данных?

У меня есть фрейм данных, и некоторые столбцы имеют значения NA. Как заменить эти значения NA на нули?
задан 17 нояб. '11 в 6:45
18
ответов

Добавить одну строку в панды DataFrame

Я понимаю, что pandas предназначен для загрузки полностью заполненного DataFrame, но мне нужно создать пустой DataFrame, а затем добавить строки, один за другим. Каков наилучший способ сделать это? Я успешно создал пустой DataFrame с: res = DataF...
задан 23 мая '12 в 11:12
26
ответов

Как изменить порядок столбцов DataFrame?

У меня есть следующий DataFrame (df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Я добавляю больше столбцов (-ов) по назначению: df['mean'] = df.mean(1) Как перенести столбец mean в начало, т.е. установит...
задан 31 окт. '12 в 1:22
12
ответов

Как удалить строки из Pandas DataFrame, значение которого в определенных столбцах равно NaN

У меня есть DataFrame: >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN...
задан 16 нояб. '12 в 12:17
12
ответов

Как получить количество строк в Pandas данных?

Я пытаюсь получить количество строк в df с помощью Pandas, и вот мой код. Способ 1: total_rows = df.count print total_rows +1 Способ 2: total_rows = df['First_columnn_label'].count print total_rows +1 Оба фрагмента кода дают мне эту ошибку: О...
задан 11 апр. '13 в 11:14