Рубрики

Свежие записи

Метрики кода. Интересный материал

GD Star Rating
loading...
GD Star Rating
loading...




Еще в прошлом  году опубликовал материал по метрикам кода, применительно к ПО IBM Rational саму тему не бросал. Вот смотрел старые архивы и обнаружил лекции о метриках, правда без опозновательных знаков. Не понятно откуда и как попали ко мне. Публикую как есть. Материал очень достойный.

Оглавление:

  • Метрики сложности программ
  • Метрики стилистики и понятности программ
  • Метрики Холстеда
  • Метрики использования языковпрограммирования и технологических средств
  • Жизненный цикл программного изделия.

В тему материала можно почитать статьи:

Метрики кода и их практическая реализация в IBM Rational ClearCase

http://msquaredtechnologies.com/


При оценке сложности программ, как правило, выделяют три основные группы метрик: метрики размера программ, метрики сложности потока управления программ и метрики сложности потока данных программ.

Оценки первой группы наиболее просты и поэтому получили широкое распространение. Традиционной характеристикой размера программ является количество строк исходного текста. Под строкой понимается любой оператор программы.

Непосредственное измерение размера программы, несмотря на свою простоту, дает хорошие результаты. Оценка размера программы недостаточна для принятия решения о ее сложности. Но вполне применима для классификации программ, существенно различающихся объемами. При уменьшении различий в объеме программ на первый план выдвигаются оценки других факторов, оказывающих влияние на сложность. Таким образом, оценка размера программы есть оценка по номинальной шкале, на основе которой определяются только категории программ без уточнения оценки для каждой категории.

К группе оценок размера программ можно отнести также метрику Холстеда. За базу принят подсчет количества операторов и операндов используемых в программе, т.е. определение размера программы.

Основу метрики Холстеда составляют четыре измеряемые характеристики программы: h1 — число уникальных операторов программы, включая символы-разделители, имена процедур и знаки операций (словарь операторов); h2 – число уникальных операндов программы (словарь операндов); N1 – общее число операторов в программе N2 – общее число операндов в программе.

Опираясь на эти характеристики, получаемые непосредственно при анализе исходных текстов программ, Холстед вводит следующие оценки

Словарь программы h=h1 + h2

Длину программы N=N1+N2

Объем программы V=N log2 h

Смысл оценок h и N достаточно очевиден, поэтому подробно рассмотрим только характеристику V.

Количество символов, используемых при реализации некоторого алгоритма, определяется в числе прочих параметров и словарей программы h, представляющим собой минимально необходимое число символов, обеспечивающих реализацию алгоритма.

Далее Холстед вводит h* — теоретический словарь программы, т.е. словарный запас, необходимый для написания программы с учетом того, что необходимая функция уже реализована в данном языке и, следовательно, программа сводится к вызову этой функции. Например, согласно Холстеду возможное осуществление процедуры выделения простого числа могло бы выглядеть так:

CALL SIMPLE (X, Y),

где Y- массив численных значений, содержащих искомое число X.

Теоретический словарь в этом случае будет состоять из

n1*: {CALL, SIMPLE (…)} n1*=2;

n2*: {X,Y}, h2*=2;

а его длина, определяемая как

h* = h1* + h2* будет равна 4.

Используя h*, Холстед вводит оценку V*: V* = h*log2h*,

с помощью которой описывается потенциальный объем программы, соотвествующий максимально компактно реализующей данный алгоритм.

Вторая наиболее представительная группа оценок сложности программ – метрики сложности потока управления программ. Как правило, с помощью этих оценок оперируют либо плотностью управляющих переходов внутри программ, либо взаимосвязями этих переходов.

И в том и в другом случае стало традиционным представление программ в виде управляющего ориентированного графа G(V,E), где V – вершины, соответствующие операторам, а E – дуги, соответствующие переходам. В дуге (U,V) – вершина V является исходной, а U – конечной. При этом U непосредственно следует V, а V непосредственно предшествует U. Если путь от V до U состоит более чем из одной дуги, тогда U следует за V, а V предшествует U.

Впервые графическое представление программ было предложено Маккейбом. Основной метрикой сложности он предлагает считать цикломатическую сложность графа программы, или, как еще называют, цикломатическое число Маккейба, характеризующее трудоемкость тестирования программы.

Для вычисления цикломатического числа Маккейба Z(G) применяется формула

Z(G) = l-v+2p,

где l – число дуг ориентированного графа G; v – число вершин; p- число компонентов связности графа.

Число компонентов связности графа можно рассматривать как количество дуг, которые необходимо добавить для преобразования графа сильносвязный. Сильносвязным называется граф, любые две вершины которого взаимно достижимы. Для графов корректных программ, т.е. графов, не имеющих недостижимых от точек входа участков и «висячих» входа и выхода, сильносвязный граф, как правило, получается путем замыкания одной вершины, обозначающей конец программы на вершину, обозначающую точку входа в эту программу.

По сути Z(G) определяет число линейно независимых контуров в сильносвязном графе. Иначе говоря, цикломатическое число Маккейба показывает требуемое число проходов для покрытия всех контуров сильносвязанного графа или количество тестовых прогонов программы, необходимых для исчерпывающего тестирования по критерию «работает каждая ветвь».


Для программы цикломатическое число при l=10, v=8, n=1 определится как Z(G) = 10-8+2=4.

Таким образом, имеется сильносвязанный граф с четырьмя линейно независимыми контурами:

a-b-c-g-e-h-a;

a-b-c-e-h-a;

a-b-d-f-e-h-a;

a-b-d-e-h-a;

Рассмотрим метрику сложности программы, получившую название «подсчет точек пересечения«, авторами которой являются М Вудвард, М Хенел и Д Хидлей. Метрика ориентирована на анализ программ, при создании которых использовалось неструктурное кодирование на таких языках, как язык ассемблера и фортран. Вводя эту метрику, ее авторы стремились оценить взаимосвязи между физическими местоположениями управляющих переходов.

Структурное кодирование предполагает использование ограниченного множества управляющих структур в качестве первичных элементов любой программы. В классическом структурном кодировании, базирующемся на работах профессора Эйндховенского технологического университета(Нидерланды) Э. Дейкстры, оперируют только тремя такими структурами: следованием операторов, развилкой из операторов, циклом над оператором. все эти разновидности изображаются простейшими планарными графами программ. По правилам структурного кодирования любая программа составляется путем выстраивания цепочек из 3х упомянутых структур или помещения одной структуры в другую. Эти операции не нарушают планарности графа всей программы.

В графе программы, где каждому оператору соответствует вершина, т.е. не исключены линейные участки , при передаче управления от вершины a к b номер оператора a равен min (a,b), а номер оператора b — max(a,b). Тогда пересечение дуг появятся, если

min(a,b) < min(p,q) < max(a,b) & max(p,q) > max (a,b) |

| min (a,b) < max(p,q) < max(a,b) & min(p,q) < min(a,b).

Иными словами, точка пересечения дуг возникает в случае выхода управления за пределы пары вершин (a,b).

Количество точек пересечения дуг графа программы дает характеристику

неструктурированности программы.

Одной из наиболее простых, но достаточно эффективных оценок сложности программ является метрика Т. Джилба, в которой логическая сложность программы определяется как насыщенность программы выражениями IF_THEN_ELSE. При этом вводятся две характеристики:

  1. СL — абсолютная сложность программы, характеризующаяся количеством операторов условия;
  2. cl — относительная сложность программы, характеризующаяся насыщенностью программы операторами условия, т.е. cl определяется как отношение CL к общему числу операторов.

Используя метрику Джилба, ее дополнили еще одной составляющей, а именно характеристикой максимального уровня вложенности оператора CLI, что позволило применить метрику Джилба к анализу циклических конструкций.

Большой интерес представляет оценка сложности программ по методу граничных значений.

Введем несколько дополнительных понятий, связанных с графом программы.

Пусть G=(V,E) — ориентированный граф программы с единственной начальной и единственной окнечной вершинами. В этом графе число входящих в вершину дуг называется отрицательной степенью вершины, а число исходящих из вершины дуг — положительной степенью вершины. Тогда набор вершин графа можно разбить на две группы:

  • вершины у которых положительная степень <=1;
  • вершины у которых положительная степень >=2.

Вершины первой группы назовем принимающими вершинами, а вершины второй группы — вершинами отбора.

Для получения оценки по методу граничных значений необходимо разбить

граф G на максимальное число подграфов G’, удовлетворяющих следующим условиям:

  1. вход в подграф осуществляется только через вершину отбора;
  2. каждый подграф включает вершину (называемую нижней границей подграфа), в которую можно попасть из любой другой вершины подграфа. Например, вершина отбора соединенная сама с собой дугой петлей, образует подграф.

Число вершин, образующих такой подграф, равно скорректированной сложности вершины отбора:

Характеристики

подграфов программ

Вершины отбора

a

b

c

d

Вершины перехода

b,c

b,d

e,f

g,h

Скорректированная сложность вершины графа

10

2

3

3

Вершины подграфа

b,c,d,

e,f,g,

h,i,j

b

l,j

g,h

Нижняя граница подграфа

k

d

i

j

Каждая принимающая вершина имеет скорректированную сложность, равную 1, кроме конечной вершины, скорректированная сложность которой равна 0. Скорректированные сложности всех вершин графа G суммируются, образуя абсолютную граничную сложность программы. После этого определяется относительная граничная сложность программы:

S0=1-(v-1)/Sa,

где S0 – относительная граничная сложность программы; Sa – абсолютная граничная сложность программы, v – общее число вершин графа программы.

Таким образом, относительная сложность программы равна

S0=1-(11/25)=0,56.

Другая группа метрик сложности программ – метрика сложности потока данных, то есть использования, конфигурации и размещения данных в программах.

Пара «модуль – глобальная переменная» обозначается как (p,r), где p – модуль, имеющий доступ к глобальной переменной r. В зависимости от наличия в программе реального обращения к переменной r формируются два типа пар «модуль – глобальная переменная» : фактические и возможные. Возможное обращение к r с помощью p показывает, что область существования r включает в себя p.

Характеристика Aup говорит о том, сколько раз модули Up действительно получили доступ к глобальным переменным, а число Pup – сколько раз они могли бы получить доступ.

Отношение числа фактических обращений к возможным определяется

Rup=Aup/Pup

Эта формула показывает приближенную вероятность ссылки произвольного модуля на произвольную глобальную переменную. Очевидно, чем выше эта вероятность, тем выше вероятность «несанкционированного» изменения какой-либо переменной, что может существенно осложнить работы, связанные с модификацией программы.

Покажем расчет метрики «модуль – глобальная переменная». Пусть в программе имеются три глобальные переменные и три подпрограммы. Если предположить, что каждая подпрограмма имеет доступ к каждой из переменных, то мы получим девять возможных пар, то есть Pup=9. Далее пусть первая подпрограмма обращается к одной переменной, вторая – двум, а третья не обращается ни к одной переменной. Тогда Aup=3, Rup=3/9.

Еще одна метрика сложности потока данных – спен.

Определение спена основывается на локализации обращения к данным внутри каждой программной секции.

Спен – это число утверждений, содержащих данный идентификатор, между его первым и последним появлением в тексте программы. Идентификатор, появившийся n раз, имеет спен, равный n-1.

Спен определяет количество контролирующих утверждений, вводимых в тело программы при построении трассы программы по этому идентификатору в процессе тестирования и отладки.

Следующей метрикой сложности потока данных программ является метрика Чепина. Существует несколько ее модификаций. Рассмотрим более простой, а с точки зрения практического использования – достаточно эффективный вариант этой метрики.

Суть метода состоит в оценке информационной прочности отдельно взятого программного модуля с помощью анализа характера использования переменных из списка ввода-вывода.

Все множество переменных, составляющих список ввода-вывода разбивается на четыре функциональные группы

  1. Р – вводимые переменные для расчетов и для обеспечения вывода. Примером может служить используемая в программах лексического анализатора переменная, содержащая строку исходного текста программы, то есть сама переменная не модифицируется, а только содержит исходную информацию.
  2. М – модифицируемые или создаваемые внутри программы переменные.
  3. C – переменные, участвующие в управлении работой программного модуля (управляющие переменные).
  4. Не используемые в программе («паразитные») переменные. Поскольку каждая переменная может выполнять одновременно несколько функций, необходимо учитывать ее в каждой соответствующей функциональной группе.

Далее вводится значение метрики Чепина:


Q = a1P + a2M + a3C + a4T ,где a1, a2, a3, a4 – весовые коэффициенты.

Весовые коэффициенты использованы для отражения различного влияния на сложность программы каждой функциональной группы. По мнению автора метрики, наибольший вес, равный трем, имеет функциональная группа С, так как она влияет на поток управления программы. Весовые коэффициенты остальных групп распределяются следующим образом: a1=1; a2=2; a4=0.5. Весовой коэффициент группы T не равен нулю, поскольку «паразитные» переменные не увеличивают сложности потока данных программы, но иногда затрудняют ее понимание. С учетом весовых коэффициентов выражение примет вил:


Q = P + 2M + 3C + 0.5T .

Следует отметить, что рассмотренные метрики сложности программы основаны на анализе исходных текстов программ, что обеспечивает единый подход к автоматизации их расчета.

Метрики стилистики и понятности программ

За время своего существования программирование перестало быть искусством отдельных исполнителей, превратившись в предмет коллективной производственной деятельности. Язык прграммирования и сами программы являются не только средством общения программиста с компьютером, но и средством общения программистов между собой. Появляются новые требования к читаемости и воспринимаемости программ, соблюдение которых упрощает контакт внутри группы разработчиков, а также позволяет обслуживать и корректировать программы без участия непосредственных разработчиков.

Наиболее простой метрикой стилистики и понятности является оценка уровня комментированности программы F:

F = Nком/Nстр,

где Nком — количество комментариев в программе;

Nстр – количество строк или операторов исходного текста.

Таким образом, метрика F отражает насыщенность программы комментариями.

Исходя из практического опыта принято считать, что F³0.1, т.е. на каждые десять строк программы должен приходиться минимум один комментарий. Как показывают исследования, комментарии распределяются по тексту программы неравномерно: в начале программы их избыток, а в середине или в конце – недостаток. Это объясняется тем, что в начале программы, как правило, расположены операторы описания идентификаторов, требующие более «плотного» комментирования. Кроме того, в начале программы также расположены «шапки», содержащие общие сведения об исполнителе, характере, функциональном назначении программы и т.п. Такая насыщенность компенсирует недостаток комментариев в теле программы, и поэтому приведенная формула недостаточно точно отражает комментированность функциональной части текста программы.

Более удачен вариант, когда вся программа разбивается на n равных сегментов и для каждого из них определяется Fi:


Fi=sign(Nком/Nстр–0.1), при этом

Уровень комментированности программы считается нормальным, если выполняется условие: F=n. В противном случае какой либо фрагмент программы дополняется комментариями до нормального уровня.

Необходимо подчеркнуть, что стилистика и понятность программ тесно связана и с размером и со сложностью программ. Поэтому не следует забывать о некоторой условности группировки метрик программ.

МЕТРИКИ ХОЛСТЕДА

Для измерения теоретической длины программы М.Холстед вводит аппроксимирующую формулу:



где h1 — словарь операторов; h2 — словарь операторов программы.

Вводя эту оценку, Холстед исходит из основных концепций теории информации, по аналогии с которыми частота использования операторов и операндов в программе пропорциональна двоичному логарифму количества их типов. Таким образом, приведенное выражение представляет собой идеализированную аппроксимацию N=N1+N2, т.е. справедливо для потенциально корректных программ, свободных от избыточности или несовершенства (стилистических ошибок). Несовершенствами можно считать следующие ситуации:

а) последующая операция уничтожает результаты предыдущих без их использования;

б) присутствуют тождественные выражения, решающие совершенно одинаковые задачи;

в) одной и той же переменной назначаются различные имена и т.п.

Подобные ситуации приводят к изменению N без изменения h.

М.Холстед утверждает, что для стилистически корректных программ отклонение в оценке теоретической длины от реальной N не превышает 10%.

При автоматизации измерения h1, h2, N1 и N2 определить N нетрудно. Тем не менее оценка представляет интерес и с другой точки зрения.

используется как эталонное значение длины программы со словарем h. Длина корректно составленной программы N, т.е. программы, свободной от избыточности и имеющей словарь h, не должна отклоняться от теоретической длины программы более чем на 10%. Таким образом, измеряя h1, h2, N1 и N2
и сопоставляя значения N и для некоторой программы, при более чем 10%-ном отклонении можно говорить о наличии в программе стилистических ошибок, т.е. несовершенств.

Другой характеристикой, принадлежащей к метрикам корректности программ, по М.Холстеду, является уровень качества программирования L (уровень программы).



где V и V* определяются




Исходным для введения этой характеристики является предположение о том, что при снижении стилистического качества программирования уменьшается содержательная нагрузка и каждый компонент программы и, как следствие, расширяется объем реализации исходного алгоритма. Учитывая это, можно оценить качество программирования на основании степени расширения текста относительно потенциального объема V*. Очевидно, для идеальной программы L=1, а для реальной — всегда L<1.

Нередко целесообразно определить уровень программы, не прибегая к оценке ее теоретического объема, поскольку список параметров программы часто зависит от реализации и может быть искусственно расширен. Это приводит к увеличению метрической характеристики качества программирования. М.Холстед предлагает аппроксимировать эту оценку выражением, включающим только фактические параметры, т.е. параметры реальной программы:



Специалисты считают более корректным при оценке программ использовать характеристику L.

Располагая характеристикой , Холстед вводит характеристику I, которую рассматривает как интеллектуальное содержание конкретного алгоритма, инвариантное по отношению к используемым языкам реализации:


Термин интеллектуальность не совсем удачен, точнее сказать что речь идет о характеристике информативности программы.

Введение характеристики I позволяет определить основные умственные затраты на создание программы. Процесс создания программы условно можно представить как ряд операций: 1) осмысление предложения известного алгоритма; 2) запись предложения алгоритма в терминах используемого языка программирования, т.е. поиск в словаре языка соответствующей инструкции, ее смысловое наполнение и запись.

Используя эту формализацию в методике Холстеда, можно сказать, что написание программы по заранее известному алгоритму есть -кратная выборка операторов и операндов из словаря программы h1, причем число сравнений (по аналогии с алгоритмами сортировки) составляет ~log2h.

Если учесть, что каждая выборка-сравнение содержит, в свою очередь, ряд мысленных элементарных решений, то можно поставить в соответствие содержательной нагрузке каждой конструкции программы сложность и число этих элементарных решений. Количественно это можно характеризовать с помощью характеристики , поскольку имеет смысл рассматривать как средний коэффициент сложности, влияющий на скорость выборки для данной программы. Тогда оценка необходимых интеллектуальных усилий по написанию программы может быть изменена как

.

Таким образом, характеризует число требуемых элементарных решений при написании программы.

Однако следует заметить, что адекватно характеризует лишь начальные усилия по написанию программ, поскольку при построении не учитываются отладочные работы, которые требуют интеллектуальных затрат иного характера. Поэтому с точки зрения практической применимости хотелось бы обратить внимание на интерпретацию этой характеристики, когда вместо теоретической длины программы используется ее реальная длина:

.

Характеристика введена исходя из предположения, что интеллектуальные усилия на написание и восприятие программы очень близки по своей природе. Однако, если при написании программы стилистические погрешности в тексте программы практически не должны отражаться на интеллектуальной трудоемкости процесса, то при попытке понять такую программу их присутствие может привести к серьезным осложнениям.

Преобразуя формулу

с учетом иполучим

.

Такое представление , а соответственно и , так как , наглядно иллюстрирует целесообразность разбиения программ на отдельные модули, поскольку интеллектуальные затраты оказываются пропорциональными квадрату объема программы, который всегда больше суммы квадратов объемов отдельных модулей.

В заключение рассмотрим еще одну метрику, по своему характеру несколько отличающуюся от предыдущих. Она опирается на принцип оценки, при котором используется измерение флуктации длин программной документации.

Исходным является предположении о том, что чем меньше изменений и корректировок вносится в программную документацию, тем более четко были сформулированы решаемые задачи на всех этапах работ. Неточности и неясности при создании ПО служат причиной увеличения количества корректировок и изменений в документации. И, напротив, демпфированный переходный процесс с немногочисленными изменениями длин документов — естественное следствие хорошо обдуманной идеи, хорошо проведенного анализа, проектирования и ясной структуры программ. Эти взаимосвязи и являются основными для данного метода оценки, суть которого состоит в следующем.

Предположим, что документация изменяется в дискретные моменты времени . Тогда в любой момент текущая длина документа может быть определена как

,

где - длина документа в предыдущий момент времени; — добавляемая часть документа; - исключаемая часть документа.

Далее вводится , представляющая собой отклонение текущей длины документа от конечного значения


Затем рассчитывается интеграл по модулю этого отклонения на интервале от до , представленный в виде суммы

.

Значение представляет собой оценку переходного процесса для интервала времени от до . Однако не учитывает изменений типа , хотя они, бесспорно, влияют на ход дальнейшего процесса.

Чтобы отразить влияние изменений такого рода, называемых в дальнейшем импульсными, вводится экспоненциальная функция, отражающая функцию отклика.

Пример импульсного изменения длины программного документа

Рис.

Заштрихованная область представляет собой дополнение к оценке , отражающее влияние импульсного изменения длины документов и вычисляется как


Таким образом, оценка длины документа пропорциональна значению импульсного изменения длины с коэффициентом пропорциональности .

В принципе импульсное изменение длины документа присутствует и при

ai<>bi , поэтому

n-1

H’n С



причем Ci=min{ai,bi}.

Если в процессе работы значения ai и bi неконтролируемы, изменяемое измерение длины учесть нельзя.

Используя конечное значение длины документа , можно записать

n = H’n /ln ,

Программная документация неоднородна по своему содержанию . С одной стороны встречаются документы , сильно зависящие от текста программы . С другой стороны , существует документация , отражающая постановку задачи , имеются спецификации и ведомости, а также материалы , относящиеся к испытаниям программ. Целесообразно данную метрику для оценки качества прежде всего эксплуатационной документации , исключая формуляр и ведомость эксплуатационных документов. Отдельно оценивается техническое задание с пояснительной запиской и описанием программы остальные документы чаще всего отражают изменения в перечисленных документах или неявно вызывают эти изменения.

Представляет интерес сам подход , дающий возможность оценивать динамику характеристик . Ведь, если вместо текущей длины документа использовать какую-либо иную характеристику, например длину программы , то все исходные предпосылки останутся в силе. Измеряя в определенные моменты времени значение исследуемой характеристики , мы можем делать выводы о ее динамке. По этим данным , выявляя резкие скачки в переходном процессе , можно судить о потере стабильности используемого ПО и о целесообразности его проектирования заново .

Возможность перехода от статических оценок к динамическим в области конструктивных характеристик качества программ представляет большой интерес .

Метрики использования языков

программирования и технологических

средств

На качество ПИ влияют средства автоматизации программирования и форма организации работ по созданию программ . Это проявляется в двух направлениях :

  • относительно уровня автоматизации работ по программированию с помощью данного средства автоматизации
  • относительно использования данного конкретного средства создания программ

    При этом первое направление характеризует качество собственно технологических программных средств, а второе — степень перенесения этого качества на итоговые ПИ .

    Для оценки языка программирования издавна существовало понятие уровня языка. Однако оно могло иметь только относительное значение , поскольку отсутствовал абсолютный показатель. Такой измеритель был предложен Холстедом. Холстед в своем понимании уровня языка опирается на понятия заложение им в такие метрические характеристики программ как , уровень программы и объем программы.

    По аналогии с высказыванием , согласно которому уровень программы реализуемой конкретным алгоритмом , не зависит от используемого языка программирования, Холстед утверждает , что изменение алгоритма при кодировании на одном и том же языке , в одинаковой степени увеличивая потенциальный объем программы , снижает ее уровень. На этом основании была выведена гипотеза о постоянстве для каждого языка программирования выражения :


    LV’ ,

    где - оценка уровня языка ;

    L — уровень программы ;

    V’- потенциальный объем программы ;

    Учитывая L=V’/V, можно записать:

    L²V ,

    это выражение Холстет использует для вычисления уровня языка. На основании статистического материала им установлены следующие значения уровня для некоторых языков :

    Язык

    Средний уровень языка

    отклонение от среднего
    x

    Английкий

    2.16

    0.74

    ПЛ/1

    1.53

    0.92

    Алгол 58

    1.21

    0.74

    Фортран

    1.14

    0.81

    Ассемблер

    0.88

    0.42

    Так как характеристика уровня языка программирования вычисляется на основе объема программ (количества логических бит для описания задачи), можно сделать вывод что среднее значение характеризует сравнительную сложность программирования на разных языках , а отклонениеx для конкретной программой от ее среднего значения для данного языка программирования показывает качество использования языковых средств.

    Преобразуем формулу LV’ ,на основании соотношения L²V к виду:

    V’²/V,

    где — оценка уровня языка;

    V’- потенциальный объем программы;

    V — объем программы.

    Постоянство определяется синхронным изменением объема программы при изменении ее потенциального объема. Иными словами, увеличение объема программы должно быть на два порядка больше увеличения количества информации по внешним связям. Следовательно, алгоритмически сложные программы вычисления единичных значений переменных будут давать значительно более низкое значение
    чем программы вычисления большого объема информации по элементарным соотношениям.

    Если программ использует только стандартные конструкции языка и не связана с созданием управляющих структур (развилок и циклов), уровень языка такой программы будет значительно выше среднестатического.

    Таким образом, предлагаемая М. Холстидом метрическая характеристика сильно зависит от уровня программы и ее специфики. Поэтому трактовать эту метрику следует как уровень языка программирования в контексте области применения, т.е. определять среднее значение уровня языка на основании статистических данных по программам конкретной предметной области. Только при сравнении со средним значением уровня языка можно сделать вывод о применимости языка программирования к реализации программ данной проблемной области, с одной стороны, и об уровне использования языковых средств — с другой. Оба вывода должны делаться на основании локальных средних значений для типологических рядов программ.

    Для определения количества ошибок Холстед вывел формулу:

    2/3

    В=E / 3000 = V/3000

    где В — количество ошибок после реализации программы на языке программирования; Е — интеллектуальные усилия при программировании; V — объем программы; 3000 — критический уровень работы по составлению программы.

    Появление в языках программирования средств семантического контроля программы, таких, как пользовательские типы данных и операторов, потребовало изменения эффективности этих средств. Основным понятием при решении этой задачи является эффект программы.

    Дефект программы представляет собой такое искажение текста программы по сравнению с эталонной, которое не обнаруживается при компиляции, но существенно влияет на исход выполнения программы. Следует отметить, что дефект может быть и не обнаружен при выполнении программы на определенном множестве исходных данных. Поэтому автор метрики С.В. Денисенко вводит понятие множества всех потенциальных дефектов программы D и числа этих дефектов I.

    Выдвигается гипотеза, согласно которой количество ошибок в программе прямо пропорционально I. Тогда для какого-либо средства статистического семантического контроля можно вычислить показатель его эффективности:

    R1 d1

    g = ——- = ——-,

    R2 d2

    где R1 — количество ошибок в программе, полученной без использования данного средства;

    R2 — количество ошибок в программе, полученной с использованием данного средства;

    d1 — количество возможных дефектов в программе, полученной без использования данного средства;

    d2 — количество возможных дефектов в программе, полученной с использованием данного средства.

    Теперь необходимо количественно оценить d1 и d2. Денисенко предлагает в качестве примера оценку эффективности контроля соответствия типов данных по всему тексту программы и ограничения области доступности переменных программы при переходе от блочной структуры к модульной.

    При оценке количества возможных дефектов, возникающих в тексте программы, оцениваются все случаи замены операторов и типов, приводящих к изменению смысла алгоритма. Количество дефектов для средств контроля типов данных определяется как

    d = d + d + d ,

    тип т N1 N2

    где d — количество дефектов от возможной замены типов данных;

    т

    d — количество дефектов от возможной замены кодов операндов;

    N1

    d — количество дефектов от возможной замены кодов операндов;

    N2

    Таким образом, взяв за базу сравнения полное отсутствие контроля типов данных, эффективность средства контроля типов данных можно оценить по формуле

    d T(T-1) + N1(1-1) + N2(2-1)

    g = ——— = Т ——————————

    тип d N1(1-T) + N2(2-T)

    тип

    где T — число типов данных;

    N1 — число операторов;

    1 — словарь операторов;

    N2 — число операндов;

     — словарь операндов;

    В качестве второго оцениваемого средства контроля Денисенко выдвигает ограничения доступности переменных программ путем применения модульной структуры со связью модулей через параметры. Количество возможных дефектов при использовании обычной блочной структуры, свойственной таким языкам, как алгол, паскаль, пл/1, увеличивается по сравнению с модульной структурой за счет возможного обращения к доступной, но не определенным по спецификации связи блоков переменным. Эта характеристика может быть вычислена как:

    dбл=dт+ dN1+ dN2+ N2nсв,

    где ncd- число внешних переменных, доступных, но не используемых в рассматриваемом блоке в соответствие с его спецификой.

    Тогда эффективность модульной реализации комплекса программ по сравнению с блочной реализацией определяется как

    Анализ метрик позволяет сделать вывод о том, что оценка языков и технологий программирования в настоящее время проводится не на основе оценки синтаксиса и состава включенных средств, а на основе пригодности этих задач, точнее, на основе вариантов реализации задач с помощью данного средства программирования. Понятно, что именно эти характеристики наиболее ценны для практики.

    Жизненный цикл программного изделия.

    Сущность развития ПИ во времени отражает объективная экономическая категория «цикл жизни». Предпосылкой для введения этой категории в сферу программных разработок послужило определение ПИ как изделия , имеющего самостоятельное значение, процессы проектирования и изготовления которого аналогичны процессам связанным с производством (изготовлением). Как и любое изделие, Пиимеет свой цикл жизни, т.е. интервал времени от начального момента возникновения объективной необходимости в ПИ до момента изъятия его из эксплуатации. Следует подчеркнуть, что жизненный цикл ПИ заканчивается в результате его морального, а не физического износа (что типично для промышленных изделий). В свою очередь, говорят что ПИ морально устарело, если оно перестает удовлетворять актуальным требованиям, а дальнейшая его модификация не представляется возможной или не выгодна, что влечет за собой необходимость в разработке нового ПИ.

    В результате анализа проблем, требующих решения в процессе создания, изучения опыта разработок и использования различных ПИ было установлено, что независимо от специфических условий, видов и требований к конкретным ПИ можно выделить некоторую типовую последовательность этапов разработки и функционирования ПИ.

    В общем виде за период своего жизненного цикла ПИ проходит 3 фазы: разработку, использование, сопровождение. Фаза разработки начинается с анализа осуществимости проекта, а далее путем последовательной трансформации преобразования от требований пользователя в форму, доступную для реализации на ЭВМ. К тому же на протяжении всей фазы закладываются основные характеристики качества будущего ПИ, которые проявляются на стадии его эксплуатации. На эту фазу приходятся, как правило, 50% стоимости ПИ и 32% трудозатрат.

    Фаза использования начинается тогда, когда изделие передается пользователю, находится в действии и используется эффективно. В фазе использования обычно выполняются обучение персонала, внедрение, настройка, сопровождение и, возможно, расширение ПИ.

    Фазу сопровождения также называют фазой продолжающейся разработки. Практиками признано, что часть жизненного цикла(ЖЦ) должна приниматься во внимание с момента начала разработки с целью совершенствования ПИ в соответствии с потребностями пользователя. Процесс сопровождения, продолжающийся параллельно собственно эксплуатации ПИ, практически в течении всего времени его использования состоит из выявления и устранения ошибок в программах и изучения из функциональных возможностей.

    Структура трудозатрат на различные виды деятельности по сопровождению такова, что на изменение функциональных возможностей ПИ уходит около 78% времени, а на выявление ошибок –17%.

    Ж.Ц. ПИ образует 4 основные стадии.

    1.Исследование и проектирование. Изучение и анализ существующих ПИ, документирование; анализ осуществимости; определение и спецификация требований к новому ПИ: концептуальное проектирование ПИ.

    2.Реализация. Детализация проекта кодирование, тестирование, установление эксплуатационных процедур.

    3.Внедрение (сдача) в опытную эксплуатацию. Приемочные тесты, обучение пользователей.

    4.Эксплуатация и сопровождение. Периодические процедуры обработки информации, рабочие прогоны программ, измерение производительности и других характеристик ПИ, сопровождение и модификация по мере появления новых требований.

    Начальные этапы определяют качество проекта и успех разработки программных средств в целом. Для начальных этапов разработки ПС типичны ситуации; выявление и четкое формулирование проблемы в условиях значительной неопределенности; выбор стратегии исследования и разработок; точное определение ПИ как системы (границы, выходы, набор компонентов); выявление целей развития и функционирования ПИ; выявление функций и состава вновь создаваемого ПИ.

    В силу значимости фазы разработки в ЖЦ ПИ рассмотрим подробнее содержание отдельных ее этапов.

    В укрупненном виде жизненный цикл ПИ можно представить состоящим из следующих этапов: определение требований к системе; определение требований к ПО; предварительное проектирование; кодирование и отладка; тестирование ПИ и системы; эксплуатация и сопровождение.

    Исходным этапом создания и является этап разработки требований, в процессе которого проводятся поисковые, исследовательские работы, формируется комплекс требований выражающий потребности пользователя в конкретном ПИ. На данном этапе будущий комплекс программы тщательно анализируется с учетом выполняемых им функций и основных свойств, обосновывается целесообразность их разработки, предварительно оцениваются трудовые и стоимостные затраты и сроки создания, вырабатываются рекомендации по выбору инструментальных средств и методов, которые предполагается использовать в процессе разработки программ. Обязательным в содержании данного этапа является также формирование требований к качеству программ в соответствии с условиями их функционирования и реализации конкретных функций. Выполнение этих работ в процессе формирования требований и формирование необходимых эксплуатационных свойств в ПИ на данном и последующих этапах их разработки позволяет, предотвратить дополнительные расходы, вызванные модификацией программ при их внедрении и сопровождении.

    Следующим этапом в процессе создания программ является этап проектирования, в процессе которого требования пользователей формируются в более точном и конкретном виде. Проектирование программ охватывает комплекс работ по разработке структуры программ и их компонентов; выбору языка программирования и конкретной конфигурации комплекса технических средств, на котором предполагается реализация разрабатываемых программ. В процессе проектирования решается задача выбора оптимальной структуры программ, определяющая содержание и характер работ на последующих этапах разработки. На данном этапе качество ПИ обеспечивается конкретными решениями и зависит в основном от организации управления разработкой, квалификации специалистов, использования прогрессивных методов, приемов, правил и средств проектирования программ.

    После проектирования программ следует их кодирование. На практике эти этапы, как правило, частично перекрываются, т.е. за проектированием отдельных модулей выполняется их программирование, а затем, возможно, и предварительная проверка правильности функционирования разработанного модуля.

    Программирование характеризуется большим числом разнообразных правил, приемов, методов и средств его выполнения, применение которых зависит от квалификации, опыта и индивидуальных особенностей программистов. Этот этап наиболее автоматизирован в процессе разработки ПИ. В настоящее время существуют десятки языков программирования и средств автоматизации, облегчающих труд программистов и повышающих его производительность, а также создающие предпосылки унификации и стандартизации процесса создания ПИ. К тому же использование современных приемов программирования, средств автоматизации, проведения различных видов проверок и контроля программирования способствует предотвращению и выявлению значительного числа ошибок, что сокращает время и расходы на этапе отладки и тестирования программ, повышает их качество.

    Этап отладки и тестирования программ, следующий за этапом программирования, имеет целью выявление и устранение ошибок в них, а так же определению, в како мере разработанные программы удовлетворяют требованиям, сформированным в спецификациях. Работы по отладке и тестированию программ характеризуются большой степенью повторяемости и являются наиболее утомительными и дорогостоящими. В связи с этим уделяется большое внимание разработке и использованию различных системных и инструментальных средств, автоматизирующих выполнение работ на данном этапе, что позволяет повысить качество разрабатываемых программ и снизить Трудоемкость их создания. По оценкам специалистов на отладку и тестирование программ затрачивается до половины общих средств на разработку программ, что тем не менее не исключает наличие в них ошибок.

    В связи с тем, что каждая из названных стадий может быть представлена различным набором составляющих ее этапов, в настоящее время существует значительное количество моделей жизненного цикла. Разнообразие моделей с теоретической точки зрения объясняется тем, что термин «Жизненный цикл», тождественен методу жизненного цикла, а сам метод включает:

    • идентификацию количества фаз (этапов) с указанием результатов, получаемых на каждом из них;
    • определение числа функций и видов работ, которые должны быть выполнены на каждой фазе.
    • отображение результатов этапов разработки, т.е. подготовка документации, которая должна быть выдана в конце каждой фазы.

    С практической точки зрения отсутствие в использовании единой модели объясняется тем, что ЖЦ моделируется либо порождается под воздействием определенной внешней среды, а не наоборот. К основным объектам формирующим внешнюю среду, относят организационно-технологические условия разработки ПИ; условия их сопровождения и эксплуатации; технические условия; структуру и режим использования ПИ; опыт и организацию коллектива разработчиков; класс решаемых задач с учетом их типа и прикладной области, и наконец, количество этапов и их наполнение в ЖЦ зависят от выделенных ресурсов (временных, трудовых, стоимостных).

    Обратим внимание, что во всех приведенных вариантах схем ЖЦ не выделен момент (что является очевидным и необходимым для промышленных изделий) их изготовления (тиражирования). Это можно объяснить двумя причинами:

  1. Невозможность разделить во времени и пространстве процесс разработки и собственно производства ПС.
  2. ПС, как уже отмечалось, не имеет физического износа. Обладая свойством фиксироваться на различных носителях, ПС не теряет и не меняет при этом свое содержание. Это особенность позволяет организовать их тиражирование и многократное применение с минимальными техническими и временными затратами.
Метрики кода. Интересный материал, 7.7 out of 10 based on 6 ratings
Смотрите описание отчуждение недвижимости здесь..

Связные и просто интересные записи:

Метки:clearcase, ibm, loc, rational, sloc, код, маккейб, метрики, программа, программирование, сложность, цикломатичность, чепин

Leave a Reply

 

 

 

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Spam protection by WP Captcha-Free