Вопросы с тегом 'dplyr'

Используйте этот тег для вопросов, связанных с функциями из пакета dplyr, таких как group_by, суммировать, фильтровать и выбирать.
3
ответов

data.table vs dplyr: может ли что-то сделать хорошо, а другое плохо или плохо?

Обзор Я относительно знаком с data.table, а не с dplyr. Я прочитал некоторые dplyr виньетки и примеры, появившиеся на SO, и до сих пор мои выводы заключаются в следующем: data.table и dplyr сравнимы по скорости, за исключением случаев, когда им...
задан 29 янв. '14 в 18:21
5
ответов

Может ли пакет dplyr использоваться для условного мутирования?

Могут ли mutate использоваться, если мутация является условной (в зависимости от значений определенных значений столбца)? Этот пример помогает показать, что я имею в виду. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6)...
задан 27 июня '14 в 22:48
8
ответов

Группировать по нескольким столбцам в dplyr, используя ввод векторной строки

Я пытаюсь передать свое понимание plyr в dplyr, но я не могу понять, как группировать по нескольким столбцам. # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, rep...
задан 18 янв. '14 в 22:26
6
ответов

Применение функции к каждой строке таблицы с помощью dplyr?

При работе с plyr мне часто было полезно использовать adply для скалярных функций, которые я должен применять к каждой строке. например. data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) ...
задан 17 февр. '14 в 2:21
7
ответов

Выберите первую и последнюю строку из сгруппированных данных

Вопрос Используя dplyr, как я могу выбрать верхние и нижние наблюдения/строки сгруппированных данных в одном выражении? Данные и пример С учетом кадра данных df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c",...
задан 21 июля '15 в 4:41
5
ответов

Суммируя несколько столбцов с dplyr?

Я немного борюсь с dplyr-синтаксисом. У меня есть кадр данных с разными переменными и одна переменная группировки. Теперь я хочу рассчитать среднее значение для каждого столбца в каждой группе, используя dplyr в R. df <- data.frame(a=sample(1:5, ...
задан 08 февр. '14 в 13:27
3
ответов

Просмотр всего кадра данных при завершении в tbl_df?

tibble (ранее tbl_df) - это версия фрейма данных, созданного пакетом манипуляции с фреймами данных dplyr в R. Он предотвращает выходы длинных таблиц при случайном вызове кадра данных. Как только кадр данных был обернут tibble/tbl_df, есть ли кома...
задан 21 апр. '14 в 2:55
7
ответов

dplyr - mutate: использовать имена динамических переменных

Я хочу использовать dplyr mutate() для создания нескольких новых столбцов в фрейме данных. Имена столбцов и их содержимое должны быть динамически сгенерированы. Пример данных из диафрагмы: require(dplyr) data(iris) iris <- tbl_df(iris) Я соз...
задан 23 сент. '14 в 22:51
4
ответов

Замена для "переименования" в dplyr

Мне нравится функция переименования plyr rename. Я недавно начал использовать dplyr и задавался вопросом, есть ли простой способ переименовать переменные, используя функцию из dplyr, которая так же проста в использовании, как и plyr rename?
задан 01 февр. '14 в 22:25
6
ответов

Извлеките столбец dplyr tbl в виде вектора

Есть ли более краткий способ получить один столбец dplyr tbl в качестве вектора, из tbl с базой данных базы данных (т.е. кадр данных/таблица не может быть подмножеством напрямую)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 &...
задан 07 февр. '14 в 5:55
5
ответов

Как выбрать строки с максимальными значениями в каждой группе с помощью dplyr?

Я хотел бы выбрать строку с максимальным значением в каждой группе с dplyr. Во-первых, я генерирую некоторые случайные данные, чтобы показать свой вопрос set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df...
задан 16 июня '14 в 9:00
4
ответов

Удаление дублированных строк с помощью dplyr

У меня есть data.frame, как это - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 9 10 0 1 10 Я х...
задан 09 апр. '14 в 13:22
4
ответов

dplyr: "Ошибка в n(): функция не должна вызываться напрямую"

Я пытаюсь воспроизвести один из примеров в пакете dplyr, но это сообщение об ошибке. Я ожидаю увидеть новый столбец n, полученный с частотой каждой комбинации. Может ли кто-нибудь сказать мне, что мне не хватает? Я triple проверил, что пакет загружен...
задан 02 апр. '14 в 6:44
2
ответов

Фильтрация строки, содержащей определенную строку с использованием dplyr

Мне нужно отфильтровать фрейм данных, используя в качестве критерия те строки, в которых содержится строка RTB. Я использую dplyr. d.del <- df %.% group_by(TrackingPixel) %.% summarise(MonthDelivery = as.integer(sum(Revenue))) %.% arrange(...
задан 04 апр. '14 в 1:15
6
ответов

Фиксирование множественного предупреждения "неизвестный столбец"

У меня есть постоянное многократное предупреждение "неизвестного столбца" для всех типов команд (например, str (x) для установки обновлений пакетов), и не уверен, как отладить это или исправить. Предупреждение "неизвестный столбец" явно связано с пе...
задан 19 авг. '16 в 17:07