Exploración de base de datos de Atributos de Calidad

Se visitó el 14 de Diciembre de 2019 el sitio http://ctp.di.fct.unl.pt/RE2017/pages/submission/data_papers/

Se encuentran tres datasets, sin embargo in interés principal de este estudio es identificar Quality Attributes, así que se utiliza la base de datos de Quality Attributes que pertenece a TeraPROMISE y se queda a discusión usar SecReq, que sólo involucra atributos de seguridad.

Un vistazo al dataset se puede observar en la siguiente lectura:

Out[1]:
ProjectID RequirementText class
0 1 'The system shall refresh the display every 60... PE
1 1 'The application shall match the color of the ... LF
2 1 ' If projected the data must be readable. On... US
3 1 ' The product shall be available during normal... A
4 1 ' If projected the data must be understandabl... US
... ... ... ...
620 15 '\tUser access should be limited to the permis... SE
621 15 ' \tThe product must comply with the intranet ... LF
622 15 ' The intranet pages should display appropriat... LF
623 15 ' \tThe users should be able to easily use the... US
624 15 ' \tThe product interface should be fast. The ... PE

625 rows × 3 columns

Análisis Exploratorio de Datos

Out[2]:
Out[3]:

Descripción del tamaño de los requisitos

Out[7]:
count    625.000000
mean     122.480000
std       62.126757
min       40.000000
25%       79.000000
50%      107.000000
75%      146.000000
max      520.000000
Name: req_length, dtype: float64

Distribución hasta el Cuantil 95

Distribución de Dataset

Análisis proporcionado en Automatically Classifying Functional and Non-functional Requirements Using Supervised Machine Learning

Categoría Cantidad Porcentage Tamaño
Funcional (F) 255 40.80% 20
Avalilability (A) 21 3.36% 19
Faul Tolerance (FT) 10 1.60% 19
Legal (L) 13 2.08% 18
Look & Feel (LF) 38 6.08% 20
Mantainabilty (MN) 17 2.72% 28
Operational (O) 62 9.92% 20
Performance (PE) 54 8.64% 22
Portability (PO) 1 0.16% 14
Scalability (SC) 21 3.36% 18
Security (SE) 66 10.56% 20
Usability (US) 67 10.72% 22
Total 625 100%