1-Domanda:
I dati ricavati dal Web possono essere classificati come
Risposta:
Strutturati, non strutturati, semi strutturati
2-Domanda:
Un dato può essere definito come
Risposta:
Un fatto oggettivo
3-Domanda:
ARPANET è ora conosciuto come
Risposta:
Internet
4-Domanda:
Il termine dato deriva dal latino
Risposta:
Datum
5-Domanda:
Foto e video fanno parte dei dati
Risposta:
Non Strutturati
6-Domanda:
Gli user generated content sono
Risposta:
Dati generati dagli utenti
7-Domanda:
I dati business generated sono
Risposta:
Dati che possono essere generati sia da macchine che da utenti
8-Domanda:
Il Valore dei big data indica
Risposta:
La loro capacità di creare nuove informazioni
9-Domanda:
I Big Data trovano applicazione
Risposta:
In molteplici settori
10-Domanda:
L'approccio Data Driven
Risposta:
permette di condurrre la gestione in base a dati e informazioni raccolti
11-Domanda:
La teorizzazione degli Samll Data è attribuita a
Risposta:
Martin Lindstorm
12-Domanda:
Gli Small Data
Risposta:
Provengono da raccoltedati interne
13-Domanda:
Smal Data and Smaller Bricks saved
Risposta:
Lego
14-Domanda:
Il Data Mining può essere definito come
Risposta:
un processo iterativo
15-Domanda:
Le principali attività del Data Mining sono
Risposta:
descrivere e predire
16-Domanda:
KDD sta pe
Risposta:
Knowledge Discovery in Databases
17-Domanda:
Il data mining è divido in due tipologie
Risposta:
Supervisionato e non supervisionato
18-Domanda:
La metodologia CRISP si compone di
Risposta:
6 passaggi
19-Domanda:
La metodologia ASUM-DM si compone di
Risposta:
4 passaggi
20-Domanda:
Le tecniche di data mining possono essere classificate in un numero di categorie pari a
Risposta:
4
21-Domanda:
La cluster analysis è una tecnica di
Risposta:
segmentazione
22-Domanda:
La regressione logista è una tecnica di
Risposta:
previsione
23-Domanda:
L'ultima fase della preparazione dei dati è
Risposta:
la riduzione del volume dei dati
24-Domanda:
La predisposizione dei dati di input comprende
Risposta:
data discovery, characterization e assembly
25-Domanda:
Durante la data characterization vengono controllati/e
Risposta:
fonti dati
26-Domanda:
Le righe delle matrici dei dati sono
Risposta:
le unità statistiche
27-Domanda:
Per ridurre la dimensionalità dei dati viene usata
Risposta:
l'analisi delle componenti principali
28-Domanda:
La data visualization è
Risposta:
l'esplorazione visuale e interattiva
29-Domanda:
Le componenti dell'ACP devono essere
Risposta:
incorrelate
30-Domanda:
All'interno dell'ambiente R è possibile
Risposta:
elaborare dati
31-Domanda:
R nasce presso il Dipartimento di Statistica dell'Università di
Risposta:
Auckalnd
32-Domanda:
R è un discendente di
Risposta:
S e C
33-Domanda:
R è un software case sensitive, ovvero
Risposta:
distingue lettere maiuscole e minuscole
34-Domanda:
R consente di lavorare su diverse strutture di dati, che possiamo definire come
Risposta:
oggetti
35-Domanda:
Con il comando object è possibile
Risposta:
visualizzare gli oggetti
36-Domanda:
Gli output generati da R
Risposta:
possono essere esportati solo in alcuni formati
37-Domanda:
Con il comando c(….) si genera
Risposta:
un vettore
38-Domanda:
Il simbolo <- è equivalente al comando
Risposta:
assign()
39-Domanda:
La funzione range() restituisce
Risposta:
un vettore con i valori minimo e massimo
40-Domanda:
La parola indice deriva da
Risposta:
index
41-Domanda:
Le tre entità che descrivono un indicatore sono
Risposta:
comunicazione, semplificazione, quantificazione
42-Domanda:
Un fenomeno complesso è frutto di
Risposta:
concetti
43-Domanda:
Dal punto di vista operativo, ogni variabile latente è definita da
Risposta:
un indicatore
44-Domanda:
Ogni indicatore deve essere
Risposta:
coerente e adeguato
45-Domanda:
Per procedere all'ossrvazione dei fenomeni è necesssario deginire alla base
Risposta:
modello concettuale, costrutti, variabili latenti e indicatori
46-Domanda:
L'affidabilità della misurazione è data dalla correlazione tra gli indicatori e da
Risposta:
numero di indicatori
47-Domanda:
In base alla modalità di costruzione, gli indicatori si distinguono in
Risposta:
semplici, sintetici, compositi
48-Domanda:
In base al livello di comunicazione, gli indicatori si distinguono in
Risposta:
cold, hot e warm
49-Domanda:
L'ISU viene calcolato
Risposta:
ogni 2 anni
50-Domanda:
Gli indicatori compositi possono essere definiti come
Risposta:
combinazione matematca di indicatori elementari
51-Domanda:
Un indicatore composito deve sempre essere accompagnato da informazioni dettagliate su
Risposta:
Componenti, metodologia, modalità di interpretazione e punti di debolezza
52-Domanda:
Un indicatore composito, a volte, viene sostituito da
Risposta:
un cruscotto di indicatore
53-Domanda:
Le fasi per la costruzione di un indicatores sono
Risposta:
11
54-Domanda:
individuazione con accuratezza e oggettività degli indicatori elementari è la fase
Risposta:
2
55-Domanda:
L'analisi fattoriale può essere utilizzata nella fase numero
Risposta:
4
56-Domanda:
La trasformazione dei dati può essere fatta con
Risposta:
Numeri indice
57-Domanda:
La ponderazione degli indicatori è fatta con
Risposta:
approccio soggettivo o oggettivo
58-Domanda:
Il primo problema da affrontare è relativo a
Risposta:
misurazione
59-Domanda:
Per la costruzione di un indicatore composito è possibile avere problemi in merito a
Risposta:
determinazione delle componenti
60-Domanda:
La definizione di qualità è data da
Risposta:
American Society for Quality
61-Domanda:
Ogni servizio è realizzato dall'interazione tra
Risposta:
risorse umane, mezzi e tecnologie, utenti
62-Domanda:
Non immagazzinabilità significa
Risposta:
produzione e consumo non separabili
63-Domanda:
Tra gli aspetti che concocrrono a formare il concetto di qualità troviamo
Risposta:
qualità tecnica
64-Domanda:
Gli obiettivi dell'SPC sono
Risposta:
3
65-Domanda:
La Customer Satisfaction diviene rilevante nel
Risposta:
1950
66-Domanda:
Il modello di costruzione della qualità si compone di un numero di elementi pari a
Risposta:
5
67-Domanda:
La qualità prevista individua
Risposta:
bisogni latenti o manifesti
68-Domanda:
La non qualità è data dalla differenza tra
Risposta:
qualità percepita e prevista
69-Domanda:
Alla base della piramide del modello di Customer Satisfaction della Japan Management Association troviamo
Risposta:
Clienti
70-Domanda:
Le criticità riiscontrabili durante la misurazione sono
Risposta:
6
71-Domanda:
Una delle criticità è
Risposta:
la scala influenza i risultati ottenuti
72-Domanda:
Tra i modelli troviamo
Risposta:
modelli formativi o compositivi
73-Domanda:
Il quarto gruppo di modelli è dato dai modelli a reti
Risposta:
baesyane
74-Domanda:
Servqual sta per
Risposta:
Service Quality
75-Domanda:
Il modello Servqual si basa su
Risposta:
teoria dei gap
76-Domanda:
Il coefficiente α di Cronbach serve per valutare
Risposta:
valutare l'affidabilità degli indicatori
77-Domanda:
Il CSI è
Risposta:
Customer Satisfaction Index
78-Domanda:
Il Qualitometro considera
Risposta:
qualità attesa e percepita
79-Domanda:
L'ACSI è
Risposta:
American Customer Satisfaction Index
80-Domanda:
L'indagine preliminare consiste nel consulatare
Risposta:
dati secondari
81-Domanda:
Il concetto di atteggiamento fu introdotto da
Risposta:
Thurstone
82-Domanda:
Il concetto di atteggiamento fu introdotto negli anni
Risposta:
30
83-Domanda:
La misurazione associa
Risposta:
numeri e caratteristiche
84-Domanda:
Le variabili oggetto di misurazione si classificano in
Risposta:
qualitative e quantitative discrete o continue
85-Domanda:
Le scale di misurazione si classificano in
Risposta:
scale metriche e non metriche
86-Domanda:
La procedura per un'indagine di CS è formata da un numero di fasi pari a
Risposta:
5
87-Domanda:
Il pre-test è una fase di
Risposta:
sperimentazione
88-Domanda:
L'indagine pilota viene eseguita su
Risposta:
un piccolo gruppo
89-Domanda:
L'alfa di Cronbach serve per valutare
Risposta:
la consistenza interna delle scale
90-Domanda:
Un secondo momento di esecuzione dell'indagine è la definizione di
Risposta:
piano di campionamento
91-Domanda:
La scelta della tecnica più adatta per l'acquisizione delle informazioni oggetto della rilevazione è effettuata sulla base di considerazioni
Risposta:
teoriche e pratiche
92-Domanda:
Il campionamento probabilistico è composto da un numero di campionamenti pari a
Risposta:
4
93-Domanda:
Il campionamento casuale stratificato si usa quando le unità statistiche possono essere suddivise in
Risposta:
n gruppi
94-Domanda:
Il campionamento casuale stratificato si usa quando la popolazione è
Risposta:
numerosa
95-Domanda:
I metodi di campionamento non probabilistico sono
Risposta:
4
96-Domanda:
Il campionamento per quote è un particolare campionamento a scelta
Risposta:
ragionata
97-Domanda:
Nel campionamento di convenienza le unità statistiche hanno
Risposta:
non uguale probabilità di essere scelte
98-Domanda:
Nel campionamento a valanga le unità sono selezionate
Risposta:
casualmente
99-Domanda:
Nel campionamento a grappoli la popolazione è divisa in
Risposta:
gruppi
100-Domanda:
Il numero dei parametri nel modello di regressione lienare semplice è pari a
Risposta:
2
101-Domanda:
L'ipotesi di omoschedasticità presuppone che
Risposta:
Tutte le variabili abbiano uguali varianze
102-Domanda:
L'indice R2 assume valori
Risposta:
Compresi tra 0 e 1
103-Domanda:
Nel modello di regressione lineare semplice, la somma degli errori al quadrato è
Risposta:
Un minimo
104-Domanda:
I parametri nel modello di regressione lineare sono stimati mediante il metodo di
Risposta:
Minimi quadrati
105-Domanda:
Nel modello di regressione lineare semplice, con il termine predittore si intende
Risposta:
La variabili indipendente
106-Domanda:
Nel modello di regressione lineare semplice, centrando gli scarti, il coefficiente angolare
Risposta:
Non si modifica
107-Domanda:
Nel modello di regressione lineare semplice, l'indice R2 è uguale a
Risposta:
Quadrato dell'indice di correlazione
108-Domanda:
Nel modello di regressione lineare semplice, la somma degli errori è uguale a
Risposta:
0
109-Domanda:
Il numero di variabili indipendenti nel modello di regressione lineare semplice è
Risposta:
1
110-Domanda:
Il modello di regressione lineare multiplo fa parte delle tecniche di
Risposta:
Tecniche di previsione e classificazione
111-Domanda:
Il numero dei parametri nel modello di regressione lienare multiplo è pari a
Risposta:
Numero di variabili indipendenti +1
112-Domanda:
L'indice R2 assume valori
Risposta:
Compresi tra 0 e 1
113-Domanda:
Per multicollinearità di intende
Risposta:
La correlazione tra le variabili indipendenti
114-Domanda:
I parametri nel modello di regressione lienare sono stimati mediante il metodo di
Risposta:
Minimi quadrati
115-Domanda:
Nel modello di regressione lineare multiplo, con il termine predittori si intende
Risposta:
Le variabili indipendenti
116-Domanda:
La Cluster Analysis è una tecnica di
Risposta:
Tecniche di segmentazione
117-Domanda:
L'Analisi Fattoriale è una tecnica di
Risposta:
Riduzione dei dati
118-Domanda:
Nel modello di regressione lineare multiplo, la somma degli errori è
Risposta:
Nulla
119-Domanda:
Il numero di variabili indipendenti nel modello di regressione lineare multiplo è
Risposta:
Più di uno
120-Domanda:
L'AMD studia
Risposta:
fenomeni complessi
121-Domanda:
L'AMD opera con
Risposta:
regole geometriche ed algebriche
122-Domanda:
La tabella unità statistiche*variabili, nell'AMD, è
Risposta:
una matrice di dati
123-Domanda:
Nell'AMD, può essere una matrice di base
Risposta:
una matrice di distanza
124-Domanda:
I metodi fattoriali consentono
Risposta:
la rappresentazione in uno spazio ridotto
125-Domanda:
L'ACP può essere usata in presenza di variabili
Risposta:
esclusivamente quantitative
126-Domanda:
I gruppi che derivano dai metodi di classificazione sono caratterizzati da
Risposta:
omogeneità interna
127-Domanda:
Le partizioni derivano dall'applicazione di
Risposta:
metodi non gerarchici
128-Domanda:
I metodi gerarchici agglomerativi sono
Risposta:
metodi di classificazionie con aggregazioni successive
129-Domanda:
Rappresenta una estensione dell'AC
Risposta:
l'ACM
130-Domanda:
Il singolo elemento di un vettore si denota con
Risposta:
una lettera minuscola in corsivo
131-Domanda:
L'operazione che ci permette di passare da un vettore riga ad un vettore colonna, o viceversa, è
Risposta:
la trasposizione
132-Domanda:
La rappresentazione grafica di un vettore avviene in uno spazio
Risposta:
le cui dimensioni dipendono dal numero di elementi del vettore
133-Domanda:
Assumendo x come uno scalare ed a come un vettore, indicare quale delle seguenti uguaglianze/disuguaglianze è valida
Risposta:
a * x = x * a
134-Domanda:
Se sottraggo un vettore ad uno scalare, ottengo
Risposta:
un vettore con le stesse dimensioni
135-Domanda:
Moltiplicando un vettore per lo scalare -1, il risultato sarà
Risposta:
il vettore opposto
136-Domanda:
Se addiziono un vettore al suo opposto ottengo
Risposta:
il vettore nullo
137-Domanda:
La sottrazione tra vettori è, ad esempio, possibile
Risposta:
tra due vettori riga con uguale dimensione
138-Domanda:
Il risultato del prodotto tra vettori sarà
Risposta:
uno scalare
139-Domanda:
Per calcolare la somma dei quadrati degli elementi del vettore posso utilizzare
Risposta:
il prodotto scalare
140-Domanda:
Se in una matrice scambio le righe con le colonne ottengo
Risposta:
la matrice trasposta
141-Domanda:
In una matrice simmetrica
Risposta:
gli elementi coniugati rispetto alla diagonale principale sono uguali
142-Domanda:
La traccia di una matrice è
Risposta:
la somma degli elementi sulla diagonale principale
143-Domanda:
La differenza tra matrici
Risposta:
è possibile solo tra matrici con stessa dimensione
144-Domanda:
La somma di due matrici genera
Risposta:
una matrice con la stessa dimensione delle matrici che sono gli addendi dell'operazione
145-Domanda:
Nel prodotto tra matrici, è vera l'uguaglianza
Risposta:
A m x n * B n x p = C m x p
146-Domanda:
In una matrice, gli elementi da a1n ad am1 costituiscono
Risposta:
la diagonale secondaria
147-Domanda:
La regola di Sarrus consente di calcolare
Risposta:
il determinante di una matrice di ordine 3
148-Domanda:
Il prodotto tra una matrice e la sua inversa genera
Risposta:
la matrice identità
149-Domanda:
Le soluzioni dell'equazione caratteristica di una matrice rappresentano
Risposta:
gli autovalori
150-Domanda:
L'obiettivo di una ACP è di
Risposta:
sintetizzare il fenomeno
151-Domanda:
Ha senso condurre una ACP quando
Risposta:
tra le variabili di partenza esiste correlazione
152-Domanda:
Nella ACP, la matrice dei dati è
Risposta:
una tabella unità*variabili
153-Domanda:
Se le variabili non sono espresse nella stessa unità di misura, l'ACP viene condotta
Risposta:
sulla matrice di correlazione
154-Domanda:
Gli autovalori di una matrice sono
Risposta:
numeri reali positivi
155-Domanda:
Il peso di ciascuna variabile rispetto ad ogni componente principale viene espresso
Risposta:
dall'autovettore
156-Domanda:
Tra i criteri per la scelta del numero delle componenti, non rientra
Risposta:
il criterio dellla correlazione unitaria
157-Domanda:
Le componenti principali
Risposta:
sono ortogonali e riproducono in senso decrescente la variabilità
158-Domanda:
Le variabili che hanno un maggiore contributo sulla componente
Risposta:
sono lontane dal baricentro, sia sul semiasse positivo che su quello negativo
159-Domanda:
Col cerchio delle correlazioni, visualizziamo
Risposta:
il contributo di ciascuna variabile alla spiegazione delle componenti
160-Domanda:
Nella ACP, può essere una matrice di base
Risposta:
una matrice di varianza/covarianza
161-Domanda:
In una matrice dei dati per ACP
Risposta:
in colonna ci sono le variabili
162-Domanda:
Il generico elemento aij della matrice dei dati di una ACP
Risposta:
rappresenta il valore della j-esima variabile osservata sull'i-esima unità
163-Domanda:
Per condurre una ACP posso usare una matrice di varianza e covarianza
Risposta:
se le variabili sono espresse nella stessa unità di misura
164-Domanda:
Il prodotto tra la matrice trasposta centrata e la matrice centrata restituisce
Risposta:
la matrice di devianza e codevianza
165-Domanda:
La matrice di varianza e covarianza è una matrice
Risposta:
quadrata
166-Domanda:
La traccia della matrice di correlazione
Risposta:
coincide col numero delle variabili
167-Domanda:
Se la matrice standardizzata ha dimensioni 5 x 4, la dimensione della matrice di correlazione sarà
Risposta:
4 x 4
168-Domanda:
In una matrice di correlazione
Risposta:
l'elemento a31 = l'elemento a13
169-Domanda:
La matrice di correlazione è
Risposta:
simmetrica
170-Domanda:
L'acronimo SPSS sta per
Risposta:
Statistical Package for Social Science
171-Domanda:
L'estensione di un file output di SPSS è
Risposta:
.spv
172-Domanda:
La Vista dati e la Vista variabili in SPSS, rientrano
Risposta:
nell'editor dei dati
173-Domanda:
Nel foglio Vista variabili, sulle righe sono riportate
Risposta:
le variabili
174-Domanda:
Nel foglio Vista Dati, le variabili sono
Risposta:
in colonna
175-Domanda:
In SPSS, è possibile limitare le elaborazioni solo ad alcune unità statistiche
Risposta:
con il comando Seleziona casi
176-Domanda:
Nell'importazione di un file Excel in SPSS
Risposta:
è possibile spuntare l'opzione Leggi i nomi delle variabili dalla prima riga di dati
177-Domanda:
Dopo aver impostato un filtro in SPSS, questo
Risposta:
resta attivo fino a quando non si selezionano nuovamente tutti i casi
178-Domanda:
Un file di output di SPSS
Risposta:
restituisce i grafici e le tabelle che risultano dalle elaborazioni
179-Domanda:
Un output di SPSS può essere esportato in word
Risposta:
sì
180-Domanda:
Tramite l'ACP si vuole creare una combinazione... dei prodotti consumati
Risposta:
lineare
181-Domanda:
I prodotti consumati rappresentano
Risposta:
le variabili osservate
182-Domanda:
Se le combinazioni fossero tutte nulle o prossime allo zero, le variabili risulterebbero
Risposta:
linearmente indipendenti
183-Domanda:
I passaggi da compiere per importare i dati in SPSS sono
Risposta:
file,apri,dati
184-Domanda:
Per modificare/aggiornare le informazioni sulle variabili bisogna cliccare su
Risposta:
vista variabili
185-Domanda:
L'ACP può essere eseguita tramite i seguenti comandi
Risposta:
Analizza, Riduzione delle dimensioni, fattore
186-Domanda:
Nella scheda degli output, la prima tabella contiene
Risposta:
le statistiche descrittive
187-Domanda:
All'interno della matrice di correlazione si osservano
Risposta:
le relazioni di concordanza e discordanza
188-Domanda:
Le coordinate delle variabili sui tre fattori sono riportate nella tabella
Risposta:
Matrice dei componenti
189-Domanda:
Per potere aggiungere gli assi al grafico delle componenti è necessario cliccare su
Risposta:
modifica, seleziona asse X (o Y), scheda scala, Visualizza linea d'origine
190-Domanda:
Il credit scoring è
Risposta:
un insieme di metodologie statisitche
191-Domanda:
La funzione originiaria del credit scoring è
Risposta:
stima del rischio di default
192-Domanda:
I modelli di credit scoring con obiettivi riguardo gli aspetti applicativi stimano
Risposta:
la provabilità di insolvenza
193-Domanda:
I modelli di credit scoring con obiettivi riguardo gli asptti prestazionali valutano
Risposta:
Il livello di rischio dei debitori esistenti
194-Domanda:
Uno degli obiettivi generali del credit scoring è quello di
Risposta:
attrarre richiedenti di qualità
195-Domanda:
La Y del modello logit è una variabile
Risposta:
dicotomica
196-Domanda:
Il modello Logit stima
Risposta:
Prob(Y=1|X)
197-Domanda:
Le Reti Neurali consentono di rappresentare le connessioni tra variabili
Risposta:
dipendenti e indipendenti
198-Domanda:
Un caso particolare di reti neurali è il modello
Risposta:
Back Propagattion Naural Network
199-Domanda:
L'acronimo CBR sta per
Risposta:
Case-Base Rasoning
200-Domanda:
Nella matrice (n,p+1), l'ultima colonna rappresenta
Risposta:
la variabile da spiegare
201-Domanda:
L'analisi fattoriale discriminante è una tecnica di
Risposta:
classificazione
202-Domanda:
Gli obiettivi dell'AFD possono essere classificati in
Risposta:
descrittivo e decisionale
203-Domanda:
L'analisi discriminante ricerca combinazion
Risposta:
lineari
204-Domanda:
La distanza tra i gruppi deve essere
Risposta:
massima
205-Domanda:
L'AFD ricerca ricerca il/l' '…… discriminante
Risposta:
Asse discriminante
206-Domanda:
Gli autovettori u rappresentano
Risposta:
i presi
207-Domanda:
Le regole di decisione sono
Risposta:
4
208-Domanda:
TEC sta per
Risposta:
Tasso di errata classificazione
209-Domanda:
Per scegliere le dimensioni del campione-test è possibile utilizzare quanti differenti metodi
Risposta:
2
210-Domanda:
L'Analisi delle Corrispondenze Binarie (AC) consente di studiare le relazioni tra quante variabili qualitative
Risposta:
2
211-Domanda:
La tabella di contingenza prevede l'incrocio tra
Risposta:
le modalità di due variabili qualitative
212-Domanda:
Nel test del chi-quadrato, i gradi di libertà sono
Risposta:
(r-1)(c-1)
213-Domanda:
Nel test del chi-quadrato, l'ipotesi nulla
Risposta:
è l'indipendenza
214-Domanda:
Nella tabella di contingenza, l'elemento n12 indica
Risposta:
il numero di volte che si presentano la prima modalità della variabile in riga e la seconda modalità della variabile in colonna
215-Domanda:
La tabella delle frequenze relative F si ottiene
Risposta:
dalla tabella di contingenza
216-Domanda:
La matrice Dr dei marginali di riga è
Risposta:
costituita da tutti zero eccetto gli elementi sulla diagonale principale
217-Domanda:
Nella AC, la matrice da diagonalizzare è
Risposta:
la matrice S, prodotto tra le matrici dei profili riga e colonna
218-Domanda:
Nell'AC, per misurare la distanza tra i profili, la distanza euclidea
Risposta:
non è adatta
219-Domanda:
La principale proprietà della metrica del chi-quadrato è
Risposta:
l'equivalenza distributiva
220-Domanda:
Nel grafico dei punti riga della AC
Risposta:
i profili riga sono contenuti nel poliedro definito dai vertici colonna della tabella
221-Domanda:
La rappresentazione β-baricentrica della AC
Risposta:
consente la rappresentazione congiunta dei profili riga e colonna
222-Domanda:
Rientra tra gli ulteriori ausilii alla interpretazione dei risultati di una AC
Risposta:
il contributo assoluto del punto alla spiegazione dell'asse
223-Domanda:
La nube dei punti della AC consente di valutare l'interdipendenza tra le variabili
Risposta:
dal punto di vista geometrico
224-Domanda:
Nella AC, il tasso di inerzia di un asse è dato da
Risposta:
rapporto tra l'autovalore dell'asse e somma di tutti gli autovalori
225-Domanda:
Quando la nube dei punti di una AC è di forma circolare e molto concentrata attorno al baricentro
Risposta:
c'è indipendenza tra le variabili
226-Domanda:
L'inerzia totale in una AC
Risposta:
determina la dispersione della nube dei punti
227-Domanda:
L'effetto Guttman di una AC
Risposta:
deriva da una tabella con frequenze prevalenti sulla diagonale principale
228-Domanda:
Nella tabella dei profili riga, il profilo medio si trova
Risposta:
nell'ultima riga
229-Domanda:
Nella AC, la tabella dei contributi assoluti
Risposta:
è separata per righe e colonne
230-Domanda:
L'Analisi delle Corrispondenze Multiple (ACM) consente di studiare le relazioni tra quante variabili qualitative
Risposta:
più di 2
231-Domanda:
Una matrice a tre vie prevede l'incrocio tra
Risposta:
le modalità di tre variabili
232-Domanda:
In una ipermatrice di contingenza
Risposta:
molte celle hanno una frequenza nulla
233-Domanda:
Nella codifica ridotta
Risposta:
posso trovare un 5
234-Domanda:
Nell'ACM, la matrice Z è del tipo
Risposta:
unità x modalità
235-Domanda:
La matrice di Burt ha
Risposta:
p x p blocchi
236-Domanda:
Nella codifica disgiuntiva completa
Risposta:
gli unici valori consentiti sono 0 e 1
237-Domanda:
I blocchi extradiagonali di una matrice di Burt
Risposta:
possono essere rettangolari
238-Domanda:
Nella ACM, è assente la rappresentazione grafica
Risposta:
dei punti-variabili
239-Domanda:
La proiezione di punti in supplementare serve a
Risposta:
arricchire il quadro interpretativo
240-Domanda:
Il termine text mining inizia ad essere utilizzato nel
Risposta:
1995
241-Domanda:
Il text mining fa parte delle tecniche
Risposta:
esplorative
242-Domanda:
Dopo aver estratto informazioni da un file di testo, esse vengono convertite in un file
Risposta:
Strutturato
243-Domanda:
Il text mining ha un approccio
Risposta:
interdisciplinare
244-Domanda:
Il text mining coinvolge
Risposta:
l'informazion retrival
245-Domanda:
L'approccio statistico considera
Risposta:
a frequenza delle parole
246-Domanda:
Il livello statistico esamina
Risposta:
co-occorrenza dei termini
247-Domanda:
Il livello pragmatico esami
Risposta:
il contesto delle parole
248-Domanda:
L'analisi dei modelli utilizza il
Risposta:
Manager Information System
249-Domanda:
Tra gli svantaggi del text mining troviamo
Risposta:
i problemi legati alla privacy
250-Domanda:
La classificazione automatica fa parte delle tecniche
Risposta:
esplorative
251-Domanda:
Le unità statistiche vengono raggruppate al fine di minimizzare la distanza
Risposta:
intra-cluster
252-Domanda:
Per definire la somiglianza/dissomiglianza tra le unità statistiche, in caso di variabili quantitative sono usate
Risposta:
le distanze
253-Domanda:
Uno dei metodi utilizzate per definire la distanza è data dalla
Risposta:
distanza di Manhattan
254-Domanda:
Per la variabili qualitative, le associazioni utilizzate sono
Risposta:
matching-type
255-Domanda:
Una delle misure di dissomiglianza è detta
Risposta:
coefficiente di Jaccard
256-Domanda:
Quando le n unitàstatistiche sono di volta in volta aggregate tra loro per creare un unico gruppo m parliamo di
Risposta:
metodo aggregativo
257-Domanda:
Quando partendo da un unico cluster contenente tutte le unità statistiche, si arriva ad ottenere n cluster, ognuno con una sola unità, abbiamo i
Risposta:
metodo scissorio
258-Domanda:
Uno dei grafici che rappresenta un'analisi cluster è detto
Risposta:
dendogramma
259-Domanda:
I metodi non gerarchici sono detti
Risposta:
metodi partitivi
260-Domanda:
I cluster sono dei gruppi di unità statistiche
Risposta:
omogenei
261-Domanda:
I gruppi che si creano con la cluster analysis sono tra loro
Risposta:
disomogenei
262-Domanda:
I metodi non gerarchici forniscono in output un numero di suddivisioni pari a
Risposta:
1
263-Domanda:
I metodi non gerarchici comprendono
Risposta:
l'algoritmo delle k-medie
264-Domanda:
I passaggi fondamentali del metodo delle k-medie sono
Risposta:
5
265-Domanda:
Un centroide può essere visto come
Risposta:
profilo medio delle unità
266-Domanda:
Tra gli algoritmi che sfruttano le caratteristiche sia dei metodi gerarchici che non gerarchici troviamo
Risposta:
l'algoritmo Two-steps
267-Domanda:
La prima tabella da considerare nei risultati di una cluster analysis è quella contenente
Risposta:
le statistiche descrittive
268-Domanda:
La tabella di appartenenza cluster è formata da
Risposta:
numero di caso, clustr, distanza
269-Domanda:
Il grafico riportato nell'analisi è detto
Risposta:
dendogramma
270-Domanda:
Le politiche di miglioramento si rendono necessarie per effetto
Risposta:
della globalizzazione e della ipercompetizione
271-Domanda:
Il sistema di Gestione per la Qualità, tra le altre cose, consente
Risposta:
di misurare i diversi scostamenti rispetto al sistema delle aspettative della clientela
272-Domanda:
Vision 2000 ha introdotto il paradigma
Risposta:
della strategia
273-Domanda:
Il miglioramento della qualità riguarda
Risposta:
prodotti, servizi, processi
274-Domanda:
Il ciclo di Deming si caratterizza per
Risposta:
la dinamicità
275-Domanda:
La fase Check nella ruota di Deming consiste nel
Risposta:
verificare le soluzioni provate
276-Domanda:
La Ruota di Deming può essere chiamata anche
Risposta:
ciclo PDCA
277-Domanda:
Gli strumenti manageriali della qualità sono
Risposta:
7
278-Domanda:
E' uno strumento manageriale della qualità
Risposta:
l'istogramma
279-Domanda:
Gli strumenti manageriali della qualità
Risposta:
sono facili da usare
280-Domanda:
Le tecniche statistiche consentono di acquisire informazioni su un sistema o un processo in modo
Risposta:
razionale, ordinato, efficiente
281-Domanda:
L'evoluzione delle metodologie di valutazione ha visto il passaggio da
Risposta:
un'ottica di produzione ad un'ottica di mercato
282-Domanda:
Può prevedere una parte comune rispetto alla raccolta dati
Risposta:
il foglio di rilevazione
283-Domanda:
Nel diagramma causa-effetto, la testa del pesce rappresenta
Risposta:
l'effetto indesiderato
284-Domanda:
L'istogramma, quale strumento manageriale della qualità, si fonda sui concetti di
Risposta:
frequenza, dispersione, classe
285-Domanda:
L'analisi di Pareto si basa sul presupposto
Risposta:
80:20
286-Domanda:
Lo strumento manageriale della qualità che consente di verificare l'esistenza di differenze tra gruppi di dati omogenei è
Risposta:
l'analisi di stratificazione
287-Domanda:
Le carte di controllo prevedono riferiment
Risposta:
alla statistica inferenziale
288-Domanda:
Nel diagramma di correlazione, in caso di correlazione inversa
Risposta:
i punti si dispongono in modo decrescente lungo una retta
289-Domanda:
Lo strumento manageriale della qualità che consente di visualizzare cause principali e secondarie di un effetto indesiderato è
Risposta:
il diagramma causa-effetto
290-Domanda:
Shewhart distingue due tipologie di variabilità
Risposta:
variabilità sistematica e variabilità dovuta a cause identificabili
291-Domanda:
Shewhart aveva come obiettivo quello di offrire uno strumento capace di stabilire se un processo fosse
Risposta:
sotto o fuori controllo
292-Domanda:
Tra i principali benefici delle carte di controllo troviamo
Risposta:
il grado di affidabilità e stabilità di un sistema di controllo
293-Domanda:
Per ottenere i dati necessari ad elaborare la carta di controllo di Shewhart, il processi viene campionato a intervalli
Risposta:
regolari
294-Domanda:
I parametri dei sottogruppi sono ricavati principalmente con il metodo che
Risposta:
usa parametri stimati e aggiustati a man mano che il processo continua
295-Domanda:
Per la costruzione dell'UCL viene utilizzata la seguente formula
Risposta:
UCL = µw + L σw
296-Domanda:
Nelle formule di calcolo dei limiti, la L rappresenta
Risposta:
la distanza dei limiti di controllo dalla linea centrale espressa in unità di deviazione standard
297-Domanda:
Il rischio di un errore di II specie dipende da
Risposta:
ampiezza dei limiti di controllo, entità del processo fuori controllo e numerosità del campione
298-Domanda:
Nel momento in cui si verifica un evento che fa scattare l'allarme, si attivano una serie di attività che possono essere riassunte da
Risposta:
OCAP-Out of Control Plan
299-Domanda:
Il metodo di Shewhart tiene in considerazione solo l'errore di I specie e l'ammontare di tale errore è
Risposta:
0,3% con i limiti 3σ
300-Domanda:
Il programma che permette di avviare Jupyter Notebook tramite interfaccia grafica è
Risposta:
anaconda navigator
301-Domanda:
Una cella in Jupyter Notebook rappresenta
Risposta:
una unità per scrivere ed eseguire codice o testo formattato
302-Domanda:
Lo strumento che non è incluso in Anaconda è
Risposta:
excel
303-Domanda:
Il comando utilizzato per visualizzare le prime righe di un DataFrame è
Risposta:
df.head()
304-Domanda:
La libreria pensata per l'analisi e la manipolazione di dataset tabulari è
Risposta:
pandas
305-Domanda:
Il comando pd.cut() serve per
Risposta:
crea categorie da valori numerici
306-Domanda:
La libreria basata su Matplotlib che consente visualizzazioni statistiche avanzate è
Risposta:
seaborn
307-Domanda:
La funzione df.describe() restituisce
Risposta:
fornisce statistiche descrittive delle variabili numeriche
308-Domanda:
Un valore vicino a -1 nella correlazione indica
Risposta:
-1
309-Domanda:
Per eseguire una cella in Jupyter Notebook si utilizza
Risposta:
cltr + invio
310-Domanda:
La statistica descrittiva esprime
Risposta:
le caratteristiche e le proprietà dei dati
311-Domanda:
Indicare uno degli indicatori di tendenza centrale
Risposta:
moda
312-Domanda:
La media è influenzata da
Risposta:
gli outlier
313-Domanda:
La deviazione standard è
Risposta:
la variabilità dei dati rispetto alla media
314-Domanda:
La deviazione standard si calcola
Risposta:
calcolando la radice quadrata della varianza
315-Domanda:
Il valore 0.97 nella matrice di correlazione indica
Risposta:
correlazione positiva molto forte
316-Domanda:
La funzione di Pandas che restituisce un riepilogo statistico delle variabili numeriche è
Risposta:
df.describe()
317-Domanda:
Il valore che viene mostrato tra i quartili nel comando df.describe() è
Risposta:
mediana
318-Domanda:
Le variabili categoriche rappresentano
Risposta:
dati qualitativi suddivisi in classi
319-Domanda:
Il comando Pandas che mostra i nomi delle colonne di un DataFrame
Risposta:
df.columns
320-Domanda:
L'EDA (Exploratory Data Analysis) è
Risposta:
il processo di analisi iniziale dei dati per comprenderne struttura e pattern
321-Domanda:
Il comando Pandas per visualizzare le prime righe di un DataFrame è
Risposta:
df.head()
322-Domanda:
Il comando df.duplicated().sum() serve per
Risposta:
contare le righe duplicate
323-Domanda:
Un boxplot rappresenta
Risposta:
la distribuzione di una variabile numerica con mediana, quartili e outlier
324-Domanda:
La funzione df.hist() viene usata per
Risposta:
generare istogrammi per tutte le colonne numeriche
325-Domanda:
Un outlier è
Risposta:
un valore estremamente distante dagli altri
326-Domanda:
Il comando sns.countplot() serve a
Risposta:
visualizzare la frequenza delle categorie di una variabile
327-Domanda:
Il pairplot di Seaborn consente di
Risposta:
esplorare le relazioni tra coppie di variabili
328-Domanda:
Una fase importante dell'EDA è
Risposta:
pulizia dei dati e identificazione dei pattern
329-Domanda:
La variabile target nel dataset del diabete è
Risposta:
outcome
330-Domanda:
La regressione lineare permette di analizzare la relazione tra quali tipi di variabili
Risposta:
variabili quantitative
331-Domanda:
La retta di regressione minimizza
Risposta:
la somma dei quadrati degli errori
332-Domanda:
Nel dataset pubblicitario ci sono
Risposta:
tv, radio e giornali
333-Domanda:
Nella regressione semplice si usa una sola variabile indipendente per prevedere
Risposta:
una variabile dipendente
334-Domanda:
La funzione linearregression() appartiene alla libreria
Risposta:
sklearn
335-Domanda:
L'r quadro (r²) indica
Risposta:
la bontà dell'adattamento del modello ai dati
336-Domanda:
Il coefficiente angolare della retta di regressione rappresenta
Risposta:
la variazione prevista della variabile dipendente per unità di x
337-Domanda:
La variabile con la correlazione lineare più alta è
Risposta:
budget per tv
338-Domanda:
La variabile target nella regressione lineare è chiamata
Risposta:
variabile dipendente
339-Domanda:
Quando l'r quadro è vicino a 1 significa che
Risposta:
il modello spiega bene la variabilità dei dati
340-Domanda:
La regressione lineare multipla consente di modellare la relazione tra una variabile target e più variabili predittive
Risposta:
stimando una retta in uno spazio multidimensionale
341-Domanda:
Il coefficiente di determinazione r² assume valori compresi tra 0 e 1 e indica
Risposta:
la frazione di variabilità della variabile dipendente spiegata dal modello
342-Domanda:
Il coefficiente di una variabile in un modello di regressione lineare multipla rappresenta
Risposta:
la variazione attesa della variabile target per ogni unità di aumento del predittore, mantenendo costanti gli altri
343-Domanda:
Un valore di r² molto alto in fase di addestramento e basso in fase di test può indicare
Risposta:
overfitting del modello
344-Domanda:
Il metodo train_test_split della libreria Scikit-learn viene utilizzato per
Risposta:
suddividere il dataset in insiemi di addestramento e test
345-Domanda:
Un residuo rappresenta
Risposta:
la differenza tra il valore osservato e quello previsto dal modello
346-Domanda:
La presenza di un pattern nei residui indica spesso che
Risposta:
il modello non ha catturato completamente la relazione tra le variabili
347-Domanda:
L'intercetta in un modello di regressione lineare rappresenta
Risposta:
il valore previsto della variabile target quando tutti i predittori sono nulli
348-Domanda:
La funzione LinearRegression della libreria Scikit-learn serve per
Risposta:
definire un modello di regressione lineare da addestrare su un dataset
349-Domanda:
Il comando model.coef_ in Scikit-learn restituisce
Risposta:
i coefficienti associati a ciascun predittore
350-Domanda:
Il machine learning è
Risposta:
un sottoinsieme dell'intelligenza artificiale che apprende dai dati
351-Domanda:
Il deep learning è
Risposta:
un sottoinsieme del machine learning basato su reti neurali profonde
352-Domanda:
Un algoritmo supervisionato utilizza
Risposta:
dati di input con output noti per apprendere
353-Domanda:
Il clustering è un esempio di
Risposta:
apprendimento non supervisionato che cerca pattern
354-Domanda:
Una feature nel machine learning è
Risposta:
una caratteristica misurabile del dato in input
355-Domanda:
Il principio garbage in, garbage out implica che
Risposta:
dati non puliti generano risultati poco affidabili
356-Domanda:
La scelta del modello in ML richiede
Risposta:
una procedura iterativa tra accuratezza, velocità e spiegabilità
357-Domanda:
Le hand-crafted features sono
Risposta:
feature costruite manualmente da chi sviluppa il modello
358-Domanda:
Un vantaggio dei modelli semplici è che
Risposta:
sono più facilmente interpretabili
359-Domanda:
Il machine learning è utile quando
Risposta:
le relazioni tra le variabili non sono note o modellabili
360-Domanda:
Nel contesto del machine learning, per classificazione si intende
Risposta:
predire a quale di un insieme di classi appartiene un esempio
361-Domanda:
La differenza principale tra classificazione e regressione consiste in
Risposta:
l'output di un classificatore è una classe, quello di un regressore un numero reale
362-Domanda:
Per classificazione binaria si intende
Risposta:
un problema con due possibili classi (es. spam vs non-spam)
363-Domanda:
Nell'apprendimento supervisionato, la funzione ipotesi h(x)h(x)h(x) serve a
Risposta:
approssimare la funzione incognita f(x)f(x)f(x) che collega input e output
364-Domanda:
Tra i seguenti, NON è un algoritmo di classificazione
Risposta:
principal pomponent analysis (PCA)
365-Domanda:
Una fase del processo di classificazione è
Risposta:
validazione
366-Domanda:
In una matrice di confusione, cosa rappresenta FP
Risposta:
istanza positiva classificata correttamente
367-Domanda:
Quale definizione descrive l'accuratezza di un classificatore
Risposta:
numero di previsioni corrette diviso il totale delle previsioni
368-Domanda:
La formula del richiamo (recall o TPR) è
Risposta:
TP / (TP + FN)
369-Domanda:
L'area sotto la curva ROC (AUC) rappresenta
Risposta:
la probabilità che un positivo casuale ottenga un punteggio di classificazione più alto di un negativo casuale
370-Domanda:
L'aspetto che si deve tenere in considerazione prima di applicare un modello di machine learning
Risposta:
qualità dei dati
371-Domanda:
Il vettore di feature rappresenta
Risposta:
array numerico di feature
372-Domanda:
Cosa si usa per visualizzare i dati dopo il binning
Risposta:
istogramma
373-Domanda:
Un valore anomalo (outlier) è definito come un dato che
Risposta:
si discosti significativamente dalla distribuzione
374-Domanda:
La normalizzazione Min-Max serve a
Risposta:
riportare i valori in [0,1]
375-Domanda:
La standardizzazione Z-score garantisce che le feature abbiano
Risposta:
mediana zero
376-Domanda:
Il binning equal-frequency suddivide i dati in bin con
Risposta:
stesso numero di osservazioni
377-Domanda:
Nel feature engineering lo scaling aiuta a
Risposta:
ridurre il numero di campioni
378-Domanda:
Quale libreria Python fornisce sia MinMaxScaler che StandardScaler
Risposta:
scikit-learn
379-Domanda:
Lo z score si calcola a partire da
Risposta:
media e devizione standard delle x
380-Domanda:
Una feature è
Risposta:
una proprietà misurabile di ogni esempio del dataset
381-Domanda:
In un dataset tabellare le righe e le colonne rappresentano
Risposta:
ogni riga è un esempio e ogni colonna è una feature
382-Domanda:
I tipi di dati possibili presenti in un dataset sono
Risposta:
dati numerici, categorici, linguaggio umano, multimediali ed embedding
383-Domanda:
Le sottocategorie principali delle feature categoriche sono
Risposta:
nominali e ordinali
384-Domanda:
Un feature vector è
Risposta:
un array di valori numerici derivati dalle feature trasformate
385-Domanda:
L'espressione garbage in-garbage out signifca
Risposta:
se i dati in ingresso sono di scarsa qualità il modello darà risultati inaffidabili
386-Domanda:
Secondo la regola empirica, rispetto ai parametri da addestrare si devono avere un numero di esempi pari a
Risposta:
almeno dieci volte il numero di parametri
387-Domanda:
Cosa si intende per classe di minoranza in un dataset sbilanciato
Risposta:
la classe meno rappresentata nel dataset
388-Domanda:
Perché si separa un dataset in train e test
Risposta:
per stimare la capacità di generalizzazione su dati mai visti
389-Domanda:
L'overfitting è
Risposta:
quando un modello apprende rumore anziché pattern generali
390-Domanda:
La classificazione supervisionata è
Risposta:
una sotto-area del machine learning
391-Domanda:
Un filtro per capire se una mail è spam o no si basa su
Risposta:
modello di classificazione supervisionato
392-Domanda:
La suddivisione in train e test dataset si fa tipicamente in percentuali di
Risposta:
70-30
393-Domanda:
Al dataset di validation si assegna tipicamente una percentuale di
Risposta:
10
394-Domanda:
La regressione logistica si basa sulla funzione
Risposta:
logit
395-Domanda:
Il random forest deriva dall'algoritmo
Risposta:
decision tree
396-Domanda:
il comando confusion_matrix(y_test, y_pred) si usa per
Risposta:
visualizzare la matrice di confusione
397-Domanda:
Per calcolare l'accuratezza in python si usa
Risposta:
model.score
398-Domanda:
Per standardizzare un dataset fra 0 e 1 si usa la funzione
Risposta:
scaler.transform
399-Domanda:
Un valore di accuratezza vicino ad 1 calcolato sul training set suggerisce che
Risposta:
ci potrebbe essere overfitting
400-Domanda:
Le cellule del sistema nervoso umano sono in grado di elaborare
Risposta:
segnali elettrici
401-Domanda:
Il neurone decide di attivarsi grazie a
Risposta:
la funzione di spike
402-Domanda:
Nel contesto di apprendimento un'epoca è
Risposta:
un passaggio completo nel dataset di train
403-Domanda:
Utilizzare batch piccole permette di
Risposta:
ridurre la memoria necessaria
404-Domanda:
La funzione di perdita indica
Risposta:
minimizza la distanza fra il valore predetto e quello reale
405-Domanda:
Problemi di divergenza nel dataset sono causati da
Risposta:
batch troppo grande
406-Domanda:
Le funzioni di attivazione
Risposta:
inotroducono non linearità nel dataset
407-Domanda:
La funzione di attivazione tanh permette di
Risposta:
produrre un output compreso fra -1 e 1
408-Domanda:
In python, hidden_layer_sizes=(50, 30) significa che
Risposta:
il primo layer ha 50 neuroni, il secondo 30
409-Domanda:
Un valore di accuracy pari a 0.97 significa che
Risposta:
il modello ha indovinato il 97% delle predizioni
410-Domanda:
Il deep learning si basa su
Risposta:
un'evoluzione delle reti neurali
411-Domanda:
Il Multilayer Perceptron
Risposta:
si compone di uno strato si input, uno o più strati nascosti e uno strato di output
412-Domanda:
Per rilevare pattern come bordi o forme è meglio usare
Risposta:
CNN
413-Domanda:
I dati sequenziali vengono gestiti meglio dai
Risposta:
RNN
414-Domanda:
Le porte di reset e update sono tipiche di
Risposta:
GRU
415-Domanda:
IL gradient descent è
Risposta:
un metodo di ottimizzazione
416-Domanda:
La funzione train_test_split in python serve per
Risposta:
dividere in dataset di train e test
417-Domanda:
Per importare in python MLPClassifier bisogna usare la libreria
Risposta:
sklearn.neural_network
418-Domanda:
Le configurazioni di reti più complesse
Risposta:
non sempre garantiscono il risultato migliore
419-Domanda:
Per eseguire il training di una rete in python si usa il comando
Risposta:
model.fit