Как считать все строки кода в каталоге рекурсивно?

У нас есть приложение PHP и мы хотим подсчитать все строки кода под определенным каталогом и его подкаталогами. Нам не нужно игнорировать комментарии, так как мы просто пытаемся получить приблизительную идею.

wc -l *.php 

Эта команда отлично работает в пределах заданного каталога, но игнорирует подкаталоги. Я думал, что это может сработать, но оно возвращается 74, что определенно не так...

find . -name '*.php' | wc -l

Какой правильный синтаксис для подачи во всех файлах?

1435
31 авг. '09 в 20:42
источник поделиться
42 ответов
  • 1
  • 2

Пытаться:

find . -name '*.php' | xargs wc -l

Инструмент SLOCCount также может помочь.

Это даст точные исходные строки кода для любой иерархии, на которую вы указываете, а также некоторую дополнительную статистику.

Отсортированный вывод: find. -name '*.php' | xargs wc -l | sort find. -name '*.php' | xargs wc -l | sort

2408
31 авг. '09 в 20:50
источник

Связанные вопросы


Похожие вопросы

Для другого однострочного:

( find ./ -name '*.php' -print0 | xargs -0 cat ) | wc -l

работает с именами с пробелами, выводит только одно число.

428
31 авг. '09 в 23:26
источник

Если использовать по-прежнему последнюю версию Bash (или ZSH), она намного проще:

wc -l **/*.php

В оболочке Bash для этого требуется установить параметр globstar, в противном случае оператор ** glob не является рекурсивным. Чтобы включить этот параметр, выполните

shopt -s globstar

Чтобы сделать это постоянным, добавьте его в один из файлов инициализации (~/.bashrc, ~/.bash_profile и т.д.).

372
04 февр. '13 в 18:11
источник

Вы можете использовать утилиту cloc которая создана именно для этой цели. Он сообщает каждому количество строк на каждом языке, а также количество комментариев и т.д. CLOC доступен в Linux, Mac и Windows.

Пример использования и вывода:

$ cloc --exclude-lang=DTD,Lua,make,Python .
    2570 text files.
    2200 unique files.                                          
    8654 files ignored.

http://cloc.sourceforge.net v 1.53  T=8.0 s (202.4 files/s, 99198.6 lines/s)
-------------------------------------------------------------------------------
Language                     files          blank        comment           code
-------------------------------------------------------------------------------
Javascript                    1506          77848         212000         366495
CSS                             56           9671          20147          87695
HTML                            51           1409            151           7480
XML                              6           3088           1383           6222
-------------------------------------------------------------------------------
SUM:                          1619          92016         233681         467892
-------------------------------------------------------------------------------
286
25 февр. '11 в 21:29
источник

В UNIX-подобных системах есть инструмент под названием cloc, который предоставляет статистику кода.

Я запустил случайную директорию в нашей базе кода, в которой говорится:

      59 text files.
      56 unique files.                              
       5 files ignored.

http://cloc.sourceforge.net v 1.53  T=0.5 s (108.0 files/s, 50180.0 lines/s)
-------------------------------------------------------------------------------
Language                     files          blank        comment           code
-------------------------------------------------------------------------------
C                               36           3060           1431          16359
C/C++ Header                    16            689            393           3032
make                             1             17              9             54
Teamcenter def                   1             10              0             36
-------------------------------------------------------------------------------
SUM:                            54           3776           1833          19481
-------------------------------------------------------------------------------
90
16 мая '14 в 19:03
источник

Вы не указали, сколько там файлов или какой желаемый результат. Это то, что вы ищите:

find . -name '*.php' | xargs wc -l
33
31 авг. '09 в 20:48
источник

Еще один вариант :)

$ find . -name '*.php' | xargs cat | wc -l

Изменение: это даст общую сумму, а не файл за файлом.

Edit2: добавить . после find чтобы заставить его работать

21
01 авг. '11 в 15:01
источник

POSIX

В отличие от большинства других ответов здесь, они работают в любой системе POSIX, для любого количества файлов и с любыми именами файлов (кроме отмеченных).


Строки в каждом файле:

find . -name '*.php' -type f -exec wc -l {} \;
# faster, but includes total at end if there are multiple files
find . -name '*.php' -type f -exec wc -l {} +

Строки в каждом файле, отсортированные по пути к файлу

find . -name '*.php' -type f | sort | xargs -L1 wc -l
# for files with spaces or newlines, use the non-standard sort -z
find . -name '*.php' -type f -print0 | sort -z | xargs -0 -L1 wc -l

Строки в каждом файле, отсортированные по количеству строк по убыванию

find . -name '*.php' -type f -exec wc -l {} \; | sort -nr
# faster, but includes total at end if there are multiple files
find . -name '*.php' -type f -exec wc -l {} + | sort -nr

Всего строк во всех файлах

find . -name '*.php' -type f -exec cat {} + | wc -l
20
29 авг. '15 в 2:08
источник

Более распространенный и простой, как и для меня, предположим, что вам нужно подсчитывать файлы с разными расширениями имен (скажем, и туземными)

wc `find . -name '*.[h|c|cpp|php|cc]'`
19
06 окт. '12 в 6:23
источник

Удивительно, но нет ответа на основе find -exec и awk. Вот так:

find . -type f -exec wc -l {} \; | awk '{ SUM += $0} END { print SUM }'

Этот фрагмент находит все файлы (-type f). Чтобы найти по расширению файла, используйте -name:

find . -name '*.py' -exec wc -l '{}' \; | awk '{ SUM += $0; } END { print SUM; }'
18
25 апр. '13 в 13:26
источник

Для подсчета строк кода в каталоге есть небольшой инструмент sloccount. Следует отметить, что он делает больше, чем вы хотите, поскольку он игнорирует пустые строки/комментарии, группирует результаты на язык программирования и вычисляет некоторые статистические данные.

17
31 авг. '09 в 20:52
источник

То, что вы хотите, это просто for цикла:

total_count=0
for file in $(find . -name *.php -print)
do
    count=$(wc -l $file)
    let total_count+=count
done
echo "$total_count"
12
31 авг. '09 в 20:50
источник

Простое, быстрое, будет использовать все возможности поиска/фильтрации find, не сработает, если слишком много файлов (переполнение числа аргументов), отлично работать с файлами со смешными символами в их имени, без используя xargs, не запускает бесполезно большое количество внешних команд (благодаря + для find -exec). Вот вы:

find . -name '*.php' -type f -exec cat -- {} + | wc -l
11
10 июля '13 в 14:06
источник

только для источников:

wc `find`

для фильтрации, просто используйте grep

wc `find | grep .php$`
11
25 нояб. '11 в 3:17
источник

Угадав, что никто никогда не увидит, что это похоронено сзади... Тем не менее, ни один из ответов до сих пор не сталкивается с проблемой имен файлов с пробелами. Кроме того, все, использующие xargs, терпят неудачу, если общая длина путей в дереве превышает ограничение по размеру оболочки оболочки (по умолчанию - несколько мегабайт в Linux). Вот тот, который исправляет эти проблемы довольно прямо. Подоболочка заботится о файлах с пробелами. awk суммирует поток отдельных файлов wc, поэтому никогда не должно заканчиваться пространство. Он также ограничивает файлы exec только файлами (пропусками каталогов):

find . -type f -name '*.php' -exec bash -c 'wc -l "$0"' {} \; | awk '{s+=$1} END {print s}' 
8
28 апр. '15 в 6:52
источник

Вы также можете попробовать CLOC (требуется Perl)

8
24 сент. '12 в 23:24
источник

Я знаю, что вопрос отмечен как , но кажется, что проблема, которую вы пытаетесь решить, также связана с PHP.

Себастьян Бергманн написал инструмент под названием PHPLOC, который делает то, что вы хотите, и, кроме того, дает вам обзор сложности проекта. Это пример его отчета:

Size
  Lines of Code (LOC)                            29047
  Comment Lines of Code (CLOC)                   14022 (48.27%)
  Non-Comment Lines of Code (NCLOC)              15025 (51.73%)
  Logical Lines of Code (LLOC)                    3484 (11.99%)
    Classes                                       3314 (95.12%)
      Average Class Length                          29
      Average Method Length                          4
    Functions                                      153 (4.39%)
      Average Function Length                        1
    Not in classes or functions                     17 (0.49%)

Complexity
  Cyclomatic Complexity / LLOC                    0.51
  Cyclomatic Complexity / Number of Methods       3.37

Как вы можете видеть, предоставленная информация намного более полезна с точки зрения разработчика, потому что она может примерно рассказать вам, насколько сложным является проект, прежде чем вы начнете работать с ним.

7
01 нояб. '13 в 2:19
источник

WC -L? лучше использовать GREP -C ^

wc -l? Неправильно! Команда wc подсчитывает новые коды строк, строки не! Когда последняя строка в файле не заканчивается новым кодом строки, это не будет считаться!

если вам все еще нужны строки подсчета, используйте grep -c ^, полный пример:

#this example prints line count for all found files
total=0
find /path -type f -name "*.php" | while read FILE; do
     #you see use grep instead wc ! for properly counting
     count=$(grep -c ^ < "$FILE")
     echo "$FILE has $count lines"
     let total=total+count #in bash, you can convert this for another shell
done
echo TOTAL LINES COUNTED:  $total

наконец, обратите внимание на wc -l trap (количество входящих, а не строк!!!)

5
10 июля '13 в 13:54
источник

Что-то другое:

wc -l `tree -if --noreport | grep -e'\.php$'`

Это отлично работает, но в текущей папке или одной из ее подпапок вам нужно иметь хотя бы один файл *.php, иначе wc stalls

4
02 февр. '13 в 17:56
источник

Если вы хотите, чтобы ваши результаты сортировались по количеству строк, вы можете просто добавить | sort или | sort -r (-r для убывающего порядка) к первому ответу, например:

find . -name '*.php' | xargs wc -l | sort -r
4
14 дек. '12 в 22:14
источник

Это очень легко с zsh globs:

wc -l ./**/*.php

Если вы используете Bash, вам просто нужно обновить. Нет абсолютно никакой причины использовать bash.

4
26 окт. '18 в 18:23
источник

Если вам нужно всего лишь общее количество строк, пусть говорят ваши PHP файлы, вы можете использовать очень простую однострочную команду даже под Windows, если у вас установлен GnuWin32. Вот так:

cat `/gnuwin32/bin/find.exe . -name *.php` | wc -l

Вам нужно указать, где именно находится find.exe, иначе Windows, на которой FIND.EXE(из старых DOS-подобных команд) будет выполняться, поскольку это, вероятно, до GnuWin32 в среде PATH и имеет разные параметры и результаты.

Обратите внимание, что в приведенной выше команде вы должны использовать обратные кавычки, а не одинарные кавычки.

3
10 февр. '11 в 13:14
источник

Для Windows простой и быстрый инструмент LocMetrics.

3
14 янв. '15 в 23:58
источник

Выдавать самые длинные файлы (т.е. возможно, эти длинные файлы нуждаются в некоторой рефакторинговой любви?) и исключая некоторые каталоги поставщиков:

 find . -name '*.php' | xargs wc -l | sort -nr | egrep -v "libs|tmp|tests|vendor" | less
3
08 июля '13 в 6:21
источник

Вам не нужны все эти сложные и трудно запоминающиеся команды. Вам просто нужен инструмент с именем line-counter.

Быстрый обзор

Вот как вы получаете инструмент

$ pip install line-counter

Используйте команду line, чтобы получить количество файлов и количество строк в текущем каталоге (рекурсивно)

$ line
Search in /Users/Morgan/Documents/Example/
file count: 4
line count: 839

Если вы хотите более подробно, просто используйте line -d.

$ line -d
Search in /Users/Morgan/Documents/Example/
Dir A/file C.c                                             72
Dir A/file D.py                                           268
file A.py                                                 467
file B.c                                                   32
file count: 4
line count: 839

И лучшая часть этого инструмента, вы можете добавить к нему .gitignore как файл конфигурации. Вы можете настроить правила, чтобы выбирать или игнорировать, какие файлы следует считать так же, как и то, что вы делаете в '.gitignore'.

Больше описания и использования здесь: https://github.com/MorganZhang100/line-counter

2
11 авг. '16 в 2:39
источник

в то время как мне нравятся сценарии, которые я предпочитаю, так как он также показывает сводку для каждого файла, если общий

wc -l `find . -name "*.php"`
2
08 окт. '14 в 8:01
источник

Я использовал этот inline- script, который я запускаю из каталога src-project:

 for i in $(find . -type f); do rowline=$(wc -l $i | cut -f1 -d" "); file=$(wc -l $i | cut -f2 -d" "); lines=$((lines + rowline)); echo "Lines["$lines"] " $file "has "$rowline"rows."; done && unset lines

Это производит этот вывод:

Lines[75]  ./Db.h has 75rows.
Lines[143]  ./Db.cpp has 68rows.
Lines[170]  ./main.cpp has 27rows.
Lines[294]  ./Sqlite.cpp has 124rows.
Lines[349]  ./Sqlite.h has 55rows.
Lines[445]  ./Table.cpp has 96rows.
Lines[480]  ./DbError.cpp has 35rows.
Lines[521]  ./DbError.h has 41rows.
Lines[627]  ./QueryResult.cpp has 106rows.
Lines[717]  ./QueryResult.h has 90rows.
Lines[828]  ./Table.h has 111rows.
2
24 сент. '14 в 18:01
источник

Если вы работаете в Linux (и я так понимаю), я рекомендую мой инструмент polyglot. Это значительно быстрее, чем sloccount или cloc и это более функционально, чем sloccount.

Вы можете вызвать его с

poly .

или же

poly

так что это гораздо более удобный для пользователя, чем какой-то замысловатый скрипт bash.

2
01 марта '18 в 6:15
источник

Если вы хотите сохранить его простым, вырежьте посредника и просто вызовите wc со всеми именами файлов:

wc -l `find . -name "*.php"`

Или в современном синтаксисе:

wc -l $(find . -name "*.php")

Работает до тех пор, пока в именах каталогов или именах файлов не будет пробелов. И до тех пор, пока у вас нет десятков тысяч файлов (современные оболочки поддерживают очень длинные командные строки). В вашем проекте 74 файла, поэтому у вас есть много возможностей для роста.

2
08 июня '16 в 23:56
источник

В OS X, по крайней мере, команды find + xarg + wc, перечисленные в некоторых других ответах, печатают "total" несколько раз в больших списках, и нет полной полной информации. Я смог получить одно общее количество файлов .c, используя следующую команду:

find . -name '*.c' -print0 |xargs -0 wc -l|grep -v total|awk '{ sum += $1; } END { print "SUM: " sum; }'

2
09 сент. '14 в 21:29
источник
  • 1
  • 2

Посмотрите другие вопросы по меткам или Задайте вопрос