1-Domanda:

I dati ricavati dal Web possono essere classificati come

Risposta:

Strutturati, non strutturati, semi strutturati

2-Domanda:

Un dato può essere definito come

Risposta:

Un fatto oggettivo

3-Domanda:

ARPANET è ora conosciuto come

Risposta:

Internet

4-Domanda:

Il termine dato deriva dal latino

Risposta:

Datum

5-Domanda:

Foto e video fanno parte dei dati

Risposta:

Non Strutturati

6-Domanda:

Gli user generated content sono

Risposta:

Dati generati dagli utenti

7-Domanda:

I dati business generated sono

Risposta:

Dati che possono essere generati sia da macchine che da utenti

8-Domanda:

Il Valore dei big data indica

Risposta:

La loro capacità di creare nuove informazioni

9-Domanda:

I Big Data trovano applicazione

Risposta:

In molteplici settori

10-Domanda:

L'approccio Data Driven

Risposta:

permette di condurrre la gestione in base a dati e informazioni raccolti

11-Domanda:

La teorizzazione degli Samll Data è attribuita a

Risposta:

Martin Lindstorm

12-Domanda:

Gli Small Data

Risposta:

Provengono da raccoltedati interne

13-Domanda:

Smal Data and Smaller Bricks saved

Risposta:

Lego

14-Domanda:

Il Data Mining può essere definito come

Risposta:

un processo iterativo

15-Domanda:

Le principali attività del Data Mining sono

Risposta:

descrivere e predire

16-Domanda:

KDD sta pe

Risposta:

Knowledge Discovery in Databases

17-Domanda:

Il data mining è divido in due tipologie

Risposta:

Supervisionato e non supervisionato

18-Domanda:

La metodologia CRISP si compone di

Risposta:

6 passaggi

19-Domanda:

La metodologia ASUM-DM si compone di

Risposta:

4 passaggi

20-Domanda:

Le tecniche di data mining possono essere classificate in un numero di categorie pari a

Risposta:

4

21-Domanda:

La cluster analysis è una tecnica di

Risposta:

segmentazione

22-Domanda:

La regressione logista è una tecnica di

Risposta:

previsione

23-Domanda:

L'ultima fase della preparazione dei dati è

Risposta:

la riduzione del volume dei dati

24-Domanda:

La predisposizione dei dati di input comprende

Risposta:

data discovery, characterization e assembly

25-Domanda:

Durante la data characterization vengono controllati/e

Risposta:

fonti dati

26-Domanda:

Le righe delle matrici dei dati sono

Risposta:

le unità statistiche

27-Domanda:

Per ridurre la dimensionalità dei dati viene usata

Risposta:

l'analisi delle componenti principali

28-Domanda:

La data visualization è

Risposta:

l'esplorazione visuale e interattiva

29-Domanda:

Le componenti dell'ACP devono essere

Risposta:

incorrelate

30-Domanda:

All'interno dell'ambiente R è possibile

Risposta:

elaborare dati

31-Domanda:

R nasce presso il Dipartimento di Statistica dell'Università di

Risposta:

Auckalnd

32-Domanda:

R è un discendente di

Risposta:

S e C

33-Domanda:

R è un software case sensitive, ovvero

Risposta:

distingue lettere maiuscole e minuscole

34-Domanda:

R consente di lavorare su diverse strutture di dati, che possiamo definire come

Risposta:

oggetti

35-Domanda:

Con il comando object è possibile

Risposta:

visualizzare gli oggetti

36-Domanda:

Gli output generati da R

Risposta:

possono essere esportati solo in alcuni formati

37-Domanda:

Con il comando c(….) si genera

Risposta:

un vettore

38-Domanda:

Il simbolo <- è equivalente al comando

Risposta:

assign()

39-Domanda:

La funzione range() restituisce

Risposta:

un vettore con i valori minimo e massimo

40-Domanda:

La parola indice deriva da

Risposta:

index

41-Domanda:

Le tre entità che descrivono un indicatore sono

Risposta:

comunicazione, semplificazione, quantificazione

42-Domanda:

Un fenomeno complesso è frutto di

Risposta:

concetti

43-Domanda:

Dal punto di vista operativo, ogni variabile latente è definita da

Risposta:

un indicatore

44-Domanda:

Ogni indicatore deve essere

Risposta:

coerente e adeguato

45-Domanda:

Per procedere all'ossrvazione dei fenomeni è necesssario deginire alla base

Risposta:

modello concettuale, costrutti, variabili latenti e indicatori

46-Domanda:

L'affidabilità della misurazione è data dalla correlazione tra gli indicatori e da

Risposta:

numero di indicatori

47-Domanda:

In base alla modalità di costruzione, gli indicatori si distinguono in

Risposta:

semplici, sintetici, compositi

48-Domanda:

In base al livello di comunicazione, gli indicatori si distinguono in

Risposta:

cold, hot e warm

49-Domanda:

L'ISU viene calcolato

Risposta:

ogni 2 anni

50-Domanda:

Gli indicatori compositi possono essere definiti come

Risposta:

combinazione matematca di indicatori elementari

51-Domanda:

Un indicatore composito deve sempre essere accompagnato da informazioni dettagliate su

Risposta:

Componenti, metodologia, modalità di interpretazione e punti di debolezza

52-Domanda:

Un indicatore composito, a volte, viene sostituito da

Risposta:

un cruscotto di indicatore

53-Domanda:

Le fasi per la costruzione di un indicatores sono

Risposta:

11

54-Domanda:

individuazione con accuratezza e oggettività degli indicatori elementari è la fase

Risposta:

2

55-Domanda:

L'analisi fattoriale può essere utilizzata nella fase numero

Risposta:

4

56-Domanda:

La trasformazione dei dati può essere fatta con

Risposta:

Numeri indice

57-Domanda:

La ponderazione degli indicatori è fatta con

Risposta:

approccio soggettivo o oggettivo

58-Domanda:

Il primo problema da affrontare è relativo a

Risposta:

misurazione

59-Domanda:

Per la costruzione di un indicatore composito è possibile avere problemi in merito a

Risposta:

determinazione delle componenti

60-Domanda:

La definizione di qualità è data da

Risposta:

American Society for Quality

61-Domanda:

Ogni servizio è realizzato dall'interazione tra

Risposta:

risorse umane, mezzi e tecnologie, utenti

62-Domanda:

Non immagazzinabilità significa

Risposta:

produzione e consumo non separabili

63-Domanda:

Tra gli aspetti che concocrrono a formare il concetto di qualità troviamo

Risposta:

qualità tecnica

64-Domanda:

Gli obiettivi dell'SPC sono

Risposta:

3

65-Domanda:

La Customer Satisfaction diviene rilevante nel

Risposta:

1950

66-Domanda:

Il modello di costruzione della qualità si compone di un numero di elementi pari a

Risposta:

5

67-Domanda:

La qualità prevista individua

Risposta:

bisogni latenti o manifesti

68-Domanda:

La non qualità è data dalla differenza tra

Risposta:

qualità percepita e prevista

69-Domanda:

Alla base della piramide del modello di Customer Satisfaction della Japan Management Association troviamo

Risposta:

Clienti

70-Domanda:

Le criticità riiscontrabili durante la misurazione sono

Risposta:

6

71-Domanda:

Una delle criticità è

Risposta:

la scala influenza i risultati ottenuti

72-Domanda:

Tra i modelli troviamo

Risposta:

modelli formativi o compositivi

73-Domanda:

Il quarto gruppo di modelli è dato dai modelli a reti

Risposta:

baesyane

74-Domanda:

Servqual sta per

Risposta:

Service Quality

75-Domanda:

Il modello Servqual si basa su

Risposta:

teoria dei gap

76-Domanda:

Il coefficiente α di Cronbach serve per valutare

Risposta:

valutare l'affidabilità degli indicatori

77-Domanda:

Il CSI è

Risposta:

Customer Satisfaction Index

78-Domanda:

Il Qualitometro considera

Risposta:

qualità attesa e percepita

79-Domanda:

L'ACSI è

Risposta:

American Customer Satisfaction Index

80-Domanda:

L'indagine preliminare consiste nel consulatare

Risposta:

dati secondari

81-Domanda:

Il concetto di atteggiamento fu introdotto da

Risposta:

Thurstone

82-Domanda:

Il concetto di atteggiamento fu introdotto negli anni

Risposta:

30

83-Domanda:

La misurazione associa

Risposta:

numeri e caratteristiche

84-Domanda:

Le variabili oggetto di misurazione si classificano in

Risposta:

qualitative e quantitative discrete o continue

85-Domanda:

Le scale di misurazione si classificano in

Risposta:

scale metriche e non metriche

86-Domanda:

La procedura per un'indagine di CS è formata da un numero di fasi pari a

Risposta:

5

87-Domanda:

Il pre-test è una fase di

Risposta:

sperimentazione

88-Domanda:

L'indagine pilota viene eseguita su

Risposta:

un piccolo gruppo

89-Domanda:

L'alfa di Cronbach serve per valutare

Risposta:

la consistenza interna delle scale

90-Domanda:

Un secondo momento di esecuzione dell'indagine è la definizione di

Risposta:

piano di campionamento

91-Domanda:

La scelta della tecnica più adatta per l'acquisizione delle informazioni oggetto della rilevazione è effettuata sulla base di considerazioni

Risposta:

teoriche e pratiche

92-Domanda:

Il campionamento probabilistico è composto da un numero di campionamenti pari a

Risposta:

4

93-Domanda:

Il campionamento casuale stratificato si usa quando le unità statistiche possono essere suddivise in

Risposta:

n gruppi

94-Domanda:

Il campionamento casuale stratificato si usa quando la popolazione è

Risposta:

numerosa

95-Domanda:

I metodi di campionamento non probabilistico sono

Risposta:

4

96-Domanda:

Il campionamento per quote è un particolare campionamento a scelta

Risposta:

ragionata

97-Domanda:

Nel campionamento di convenienza le unità statistiche hanno

Risposta:

non uguale probabilità di essere scelte

98-Domanda:

Nel campionamento a valanga le unità sono selezionate

Risposta:

casualmente

99-Domanda:

Nel campionamento a grappoli la popolazione è divisa in

Risposta:

gruppi

100-Domanda:

Il numero dei parametri nel modello di regressione lienare semplice è pari a

Risposta:

2

101-Domanda:

L'ipotesi di omoschedasticità presuppone che

Risposta:

Tutte le variabili abbiano uguali varianze

102-Domanda:

L'indice R2 assume valori

Risposta:

Compresi tra 0 e 1

103-Domanda:

Nel modello di regressione lineare semplice, la somma degli errori al quadrato è

Risposta:

Un minimo

104-Domanda:

I parametri nel modello di regressione lineare sono stimati mediante il metodo di

Risposta:

Minimi quadrati

105-Domanda:

Nel modello di regressione lineare semplice, con il termine predittore si intende

Risposta:

La variabili indipendente

106-Domanda:

Nel modello di regressione lineare semplice, centrando gli scarti, il coefficiente angolare

Risposta:

Non si modifica

107-Domanda:

Nel modello di regressione lineare semplice, l'indice R2 è uguale a

Risposta:

Quadrato dell'indice di correlazione

108-Domanda:

Nel modello di regressione lineare semplice, la somma degli errori è uguale a

Risposta:

0

109-Domanda:

Il numero di variabili indipendenti nel modello di regressione lineare semplice è

Risposta:

1

110-Domanda:

Il modello di regressione lineare multiplo fa parte delle tecniche di

Risposta:

Tecniche di previsione e classificazione

111-Domanda:

Il numero dei parametri nel modello di regressione lienare multiplo è pari a

Risposta:

Numero di variabili indipendenti +1

112-Domanda:

L'indice R2 assume valori

Risposta:

Compresi tra 0 e 1

113-Domanda:

Per multicollinearità di intende

Risposta:

La correlazione tra le variabili indipendenti

114-Domanda:

I parametri nel modello di regressione lienare sono stimati mediante il metodo di

Risposta:

Minimi quadrati

115-Domanda:

Nel modello di regressione lineare multiplo, con il termine predittori si intende

Risposta:

Le variabili indipendenti

116-Domanda:

La Cluster Analysis è una tecnica di

Risposta:

Tecniche di segmentazione

117-Domanda:

L'Analisi Fattoriale è una tecnica di

Risposta:

Riduzione dei dati

118-Domanda:

Nel modello di regressione lineare multiplo, la somma degli errori è

Risposta:

Nulla

119-Domanda:

Il numero di variabili indipendenti nel modello di regressione lineare multiplo è

Risposta:

Più di uno

120-Domanda:

L'AMD studia

Risposta:

fenomeni complessi

121-Domanda:

L'AMD opera con

Risposta:

regole geometriche ed algebriche

122-Domanda:

La tabella unità statistiche*variabili, nell'AMD, è

Risposta:

una matrice di dati

123-Domanda:

Nell'AMD, può essere una matrice di base

Risposta:

una matrice di distanza

124-Domanda:

I metodi fattoriali consentono

Risposta:

la rappresentazione in uno spazio ridotto

125-Domanda:

L'ACP può essere usata in presenza di variabili

Risposta:

esclusivamente quantitative

126-Domanda:

I gruppi che derivano dai metodi di classificazione sono caratterizzati da

Risposta:

omogeneità interna

127-Domanda:

Le partizioni derivano dall'applicazione di

Risposta:

metodi non gerarchici

128-Domanda:

I metodi gerarchici agglomerativi sono

Risposta:

metodi di classificazionie con aggregazioni successive

129-Domanda:

Rappresenta una estensione dell'AC

Risposta:

l'ACM

130-Domanda:

Il singolo elemento di un vettore si denota con

Risposta:

una lettera minuscola in corsivo

131-Domanda:

L'operazione che ci permette di passare da un vettore riga ad un vettore colonna, o viceversa, è

Risposta:

la trasposizione

132-Domanda:

La rappresentazione grafica di un vettore avviene in uno spazio

Risposta:

le cui dimensioni dipendono dal numero di elementi del vettore

133-Domanda:

Assumendo x come uno scalare ed a come un vettore, indicare quale delle seguenti uguaglianze/disuguaglianze è valida

Risposta:

a * x = x * a

134-Domanda:

Se sottraggo un vettore ad uno scalare, ottengo

Risposta:

un vettore con le stesse dimensioni

135-Domanda:

Moltiplicando un vettore per lo scalare -1, il risultato sarà

Risposta:

il vettore opposto

136-Domanda:

Se addiziono un vettore al suo opposto ottengo

Risposta:

il vettore nullo

137-Domanda:

La sottrazione tra vettori è, ad esempio, possibile

Risposta:

tra due vettori riga con uguale dimensione

138-Domanda:

Il risultato del prodotto tra vettori sarà

Risposta:

uno scalare

139-Domanda:

Per calcolare la somma dei quadrati degli elementi del vettore posso utilizzare

Risposta:

il prodotto scalare

140-Domanda:

Se in una matrice scambio le righe con le colonne ottengo

Risposta:

la matrice trasposta

141-Domanda:

In una matrice simmetrica

Risposta:

gli elementi coniugati rispetto alla diagonale principale sono uguali

142-Domanda:

La traccia di una matrice è

Risposta:

la somma degli elementi sulla diagonale principale

143-Domanda:

La differenza tra matrici

Risposta:

è possibile solo tra matrici con stessa dimensione

144-Domanda:

La somma di due matrici genera

Risposta:

una matrice con la stessa dimensione delle matrici che sono gli addendi dell'operazione

145-Domanda:

Nel prodotto tra matrici, è vera l'uguaglianza

Risposta:

A m x n * B n x p = C m x p

146-Domanda:

In una matrice, gli elementi da a1n ad am1 costituiscono

Risposta:

la diagonale secondaria

147-Domanda:

La regola di Sarrus consente di calcolare

Risposta:

il determinante di una matrice di ordine 3

148-Domanda:

Il prodotto tra una matrice e la sua inversa genera

Risposta:

la matrice identità

149-Domanda:

Le soluzioni dell'equazione caratteristica di una matrice rappresentano

Risposta:

gli autovalori

150-Domanda:

L'obiettivo di una ACP è di

Risposta:

sintetizzare il fenomeno

151-Domanda:

Ha senso condurre una ACP quando

Risposta:

tra le variabili di partenza esiste correlazione

152-Domanda:

Nella ACP, la matrice dei dati è

Risposta:

una tabella unità*variabili

153-Domanda:

Se le variabili non sono espresse nella stessa unità di misura, l'ACP viene condotta

Risposta:

sulla matrice di correlazione

154-Domanda:

Gli autovalori di una matrice sono

Risposta:

numeri reali positivi

155-Domanda:

Il peso di ciascuna variabile rispetto ad ogni componente principale viene espresso

Risposta:

dall'autovettore

156-Domanda:

Tra i criteri per la scelta del numero delle componenti, non rientra

Risposta:

il criterio dellla correlazione unitaria

157-Domanda:

Le componenti principali

Risposta:

sono ortogonali e riproducono in senso decrescente la variabilità

158-Domanda:

Le variabili che hanno un maggiore contributo sulla componente

Risposta:

sono lontane dal baricentro, sia sul semiasse positivo che su quello negativo

159-Domanda:

Col cerchio delle correlazioni, visualizziamo

Risposta:

il contributo di ciascuna variabile alla spiegazione delle componenti

160-Domanda:

Nella ACP, può essere una matrice di base

Risposta:

una matrice di varianza/covarianza

161-Domanda:

In una matrice dei dati per ACP

Risposta:

in colonna ci sono le variabili

162-Domanda:

Il generico elemento aij della matrice dei dati di una ACP

Risposta:

rappresenta il valore della j-esima variabile osservata sull'i-esima unità

163-Domanda:

Per condurre una ACP posso usare una matrice di varianza e covarianza

Risposta:

se le variabili sono espresse nella stessa unità di misura

164-Domanda:

Il prodotto tra la matrice trasposta centrata e la matrice centrata restituisce

Risposta:

la matrice di devianza e codevianza

165-Domanda:

La matrice di varianza e covarianza è una matrice

Risposta:

quadrata

166-Domanda:

La traccia della matrice di correlazione

Risposta:

coincide col numero delle variabili

167-Domanda:

Se la matrice standardizzata ha dimensioni 5 x 4, la dimensione della matrice di correlazione sarà

Risposta:

4 x 4

168-Domanda:

In una matrice di correlazione

Risposta:

l'elemento a31 = l'elemento a13

169-Domanda:

La matrice di correlazione è

Risposta:

simmetrica

170-Domanda:

L'acronimo SPSS sta per

Risposta:

Statistical Package for Social Science

171-Domanda:

L'estensione di un file output di SPSS è

Risposta:

.spv

172-Domanda:

La Vista dati e la Vista variabili in SPSS, rientrano

Risposta:

nell'editor dei dati

173-Domanda:

Nel foglio Vista variabili, sulle righe sono riportate

Risposta:

le variabili

174-Domanda:

Nel foglio Vista Dati, le variabili sono

Risposta:

in colonna

175-Domanda:

In SPSS, è possibile limitare le elaborazioni solo ad alcune unità statistiche

Risposta:

con il comando Seleziona casi

176-Domanda:

Nell'importazione di un file Excel in SPSS

Risposta:

è possibile spuntare l'opzione Leggi i nomi delle variabili dalla prima riga di dati

177-Domanda:

Dopo aver impostato un filtro in SPSS, questo

Risposta:

resta attivo fino a quando non si selezionano nuovamente tutti i casi

178-Domanda:

Un file di output di SPSS

Risposta:

restituisce i grafici e le tabelle che risultano dalle elaborazioni

179-Domanda:

Un output di SPSS può essere esportato in word

Risposta:

180-Domanda:

Tramite l'ACP si vuole creare una combinazione... dei prodotti consumati

Risposta:

lineare

181-Domanda:

I prodotti consumati rappresentano

Risposta:

le variabili osservate

182-Domanda:

Se le combinazioni fossero tutte nulle o prossime allo zero, le variabili risulterebbero

Risposta:

linearmente indipendenti

183-Domanda:

I passaggi da compiere per importare i dati in SPSS sono

Risposta:

file,apri,dati

184-Domanda:

Per modificare/aggiornare le informazioni sulle variabili bisogna cliccare su

Risposta:

vista variabili

185-Domanda:

L'ACP può essere eseguita tramite i seguenti comandi

Risposta:

Analizza, Riduzione delle dimensioni, fattore

186-Domanda:

Nella scheda degli output, la prima tabella contiene

Risposta:

le statistiche descrittive

187-Domanda:

All'interno della matrice di correlazione si osservano

Risposta:

le relazioni di concordanza e discordanza

188-Domanda:

Le coordinate delle variabili sui tre fattori sono riportate nella tabella

Risposta:

Matrice dei componenti

189-Domanda:

Per potere aggiungere gli assi al grafico delle componenti è necessario cliccare su

Risposta:

modifica, seleziona asse X (o Y), scheda scala, Visualizza linea d'origine

190-Domanda:

Il credit scoring è

Risposta:

un insieme di metodologie statisitche

191-Domanda:

La funzione originiaria del credit scoring è

Risposta:

stima del rischio di default

192-Domanda:

I modelli di credit scoring con obiettivi riguardo gli aspetti applicativi stimano

Risposta:

la provabilità di insolvenza

193-Domanda:

I modelli di credit scoring con obiettivi riguardo gli asptti prestazionali valutano

Risposta:

Il livello di rischio dei debitori esistenti

194-Domanda:

Uno degli obiettivi generali del credit scoring è quello di

Risposta:

attrarre richiedenti di qualità

195-Domanda:

La Y del modello logit è una variabile

Risposta:

dicotomica

196-Domanda:

Il modello Logit stima

Risposta:

Prob(Y=1|X)

197-Domanda:

Le Reti Neurali consentono di rappresentare le connessioni tra variabili

Risposta:

dipendenti e indipendenti

198-Domanda:

Un caso particolare di reti neurali è il modello

Risposta:

Back Propagattion Naural Network

199-Domanda:

L'acronimo CBR sta per

Risposta:

Case-Base Rasoning

200-Domanda:

Nella matrice (n,p+1), l'ultima colonna rappresenta

Risposta:

la variabile da spiegare

201-Domanda:

L'analisi fattoriale discriminante è una tecnica di

Risposta:

classificazione

202-Domanda:

Gli obiettivi dell'AFD possono essere classificati in

Risposta:

descrittivo e decisionale

203-Domanda:

L'analisi discriminante ricerca combinazion

Risposta:

lineari

204-Domanda:

La distanza tra i gruppi deve essere

Risposta:

massima

205-Domanda:

L'AFD ricerca ricerca il/l' '…… discriminante

Risposta:

Asse discriminante

206-Domanda:

Gli autovettori u rappresentano

Risposta:

i presi

207-Domanda:

Le regole di decisione sono

Risposta:

4

208-Domanda:

TEC sta per

Risposta:

Tasso di errata classificazione

209-Domanda:

Per scegliere le dimensioni del campione-test è possibile utilizzare quanti differenti metodi

Risposta:

2

210-Domanda:

L'Analisi delle Corrispondenze Binarie (AC) consente di studiare le relazioni tra quante variabili qualitative

Risposta:

2

211-Domanda:

La tabella di contingenza prevede l'incrocio tra

Risposta:

le modalità di due variabili qualitative

212-Domanda:

Nel test del chi-quadrato, i gradi di libertà sono

Risposta:

(r-1)(c-1)

213-Domanda:

Nel test del chi-quadrato, l'ipotesi nulla

Risposta:

è l'indipendenza

214-Domanda:

Nella tabella di contingenza, l'elemento n12 indica

Risposta:

il numero di volte che si presentano la prima modalità della variabile in riga e la seconda modalità della variabile in colonna

215-Domanda:

La tabella delle frequenze relative F si ottiene

Risposta:

dalla tabella di contingenza

216-Domanda:

La matrice Dr dei marginali di riga è

Risposta:

costituita da tutti zero eccetto gli elementi sulla diagonale principale

217-Domanda:

Nella AC, la matrice da diagonalizzare è

Risposta:

la matrice S, prodotto tra le matrici dei profili riga e colonna

218-Domanda:

Nell'AC, per misurare la distanza tra i profili, la distanza euclidea

Risposta:

non è adatta

219-Domanda:

La principale proprietà della metrica del chi-quadrato è

Risposta:

l'equivalenza distributiva

220-Domanda:

Nel grafico dei punti riga della AC

Risposta:

i profili riga sono contenuti nel poliedro definito dai vertici colonna della tabella

221-Domanda:

La rappresentazione β-baricentrica della AC

Risposta:

consente la rappresentazione congiunta dei profili riga e colonna

222-Domanda:

Rientra tra gli ulteriori ausilii alla interpretazione dei risultati di una AC

Risposta:

il contributo assoluto del punto alla spiegazione dell'asse

223-Domanda:

La nube dei punti della AC consente di valutare l'interdipendenza tra le variabili

Risposta:

dal punto di vista geometrico

224-Domanda:

Nella AC, il tasso di inerzia di un asse è dato da

Risposta:

rapporto tra l'autovalore dell'asse e somma di tutti gli autovalori

225-Domanda:

Quando la nube dei punti di una AC è di forma circolare e molto concentrata attorno al baricentro

Risposta:

c'è indipendenza tra le variabili

226-Domanda:

L'inerzia totale in una AC

Risposta:

determina la dispersione della nube dei punti

227-Domanda:

L'effetto Guttman di una AC

Risposta:

deriva da una tabella con frequenze prevalenti sulla diagonale principale

228-Domanda:

Nella tabella dei profili riga, il profilo medio si trova

Risposta:

nell'ultima riga

229-Domanda:

Nella AC, la tabella dei contributi assoluti

Risposta:

è separata per righe e colonne

230-Domanda:

L'Analisi delle Corrispondenze Multiple (ACM) consente di studiare le relazioni tra quante variabili qualitative

Risposta:

più di 2

231-Domanda:

Una matrice a tre vie prevede l'incrocio tra

Risposta:

le modalità di tre variabili

232-Domanda:

In una ipermatrice di contingenza

Risposta:

molte celle hanno una frequenza nulla

233-Domanda:

Nella codifica ridotta

Risposta:

posso trovare un 5

234-Domanda:

Nell'ACM, la matrice Z è del tipo

Risposta:

unità x modalità

235-Domanda:

La matrice di Burt ha

Risposta:

p x p blocchi

236-Domanda:

Nella codifica disgiuntiva completa

Risposta:

gli unici valori consentiti sono 0 e 1

237-Domanda:

I blocchi extradiagonali di una matrice di Burt

Risposta:

possono essere rettangolari

238-Domanda:

Nella ACM, è assente la rappresentazione grafica

Risposta:

dei punti-variabili

239-Domanda:

La proiezione di punti in supplementare serve a

Risposta:

arricchire il quadro interpretativo

240-Domanda:

Il termine text mining inizia ad essere utilizzato nel

Risposta:

1995

241-Domanda:

Il text mining fa parte delle tecniche

Risposta:

esplorative

242-Domanda:

Dopo aver estratto informazioni da un file di testo, esse vengono convertite in un file

Risposta:

Strutturato

243-Domanda:

Il text mining ha un approccio

Risposta:

interdisciplinare

244-Domanda:

Il text mining coinvolge

Risposta:

l'informazion retrival

245-Domanda:

L'approccio statistico considera

Risposta:

a frequenza delle parole

246-Domanda:

Il livello statistico esamina

Risposta:

co-occorrenza dei termini

247-Domanda:

Il livello pragmatico esami

Risposta:

il contesto delle parole

248-Domanda:

L'analisi dei modelli utilizza il

Risposta:

Manager Information System

249-Domanda:

Tra gli svantaggi del text mining troviamo

Risposta:

i problemi legati alla privacy

250-Domanda:

La classificazione automatica fa parte delle tecniche

Risposta:

esplorative

251-Domanda:

Le unità statistiche vengono raggruppate al fine di minimizzare la distanza

Risposta:

intra-cluster

252-Domanda:

Per definire la somiglianza/dissomiglianza tra le unità statistiche, in caso di variabili quantitative sono usate

Risposta:

le distanze

253-Domanda:

Uno dei metodi utilizzate per definire la distanza è data dalla

Risposta:

distanza di Manhattan

254-Domanda:

Per la variabili qualitative, le associazioni utilizzate sono

Risposta:

matching-type

255-Domanda:

Una delle misure di dissomiglianza è detta

Risposta:

coefficiente di Jaccard

256-Domanda:

Quando le n unitàstatistiche sono di volta in volta aggregate tra loro per creare un unico gruppo m parliamo di

Risposta:

metodo aggregativo

257-Domanda:

Quando partendo da un unico cluster contenente tutte le unità statistiche, si arriva ad ottenere n cluster, ognuno con una sola unità, abbiamo i

Risposta:

metodo scissorio

258-Domanda:

Uno dei grafici che rappresenta un'analisi cluster è detto

Risposta:

dendogramma

259-Domanda:

I metodi non gerarchici sono detti

Risposta:

metodi partitivi

260-Domanda:

I cluster sono dei gruppi di unità statistiche

Risposta:

omogenei

261-Domanda:

I gruppi che si creano con la cluster analysis sono tra loro

Risposta:

disomogenei

262-Domanda:

I metodi non gerarchici forniscono in output un numero di suddivisioni pari a

Risposta:

1

263-Domanda:

I metodi non gerarchici comprendono

Risposta:

l'algoritmo delle k-medie

264-Domanda:

I passaggi fondamentali del metodo delle k-medie sono

Risposta:

5

265-Domanda:

Un centroide può essere visto come

Risposta:

profilo medio delle unità

266-Domanda:

Tra gli algoritmi che sfruttano le caratteristiche sia dei metodi gerarchici che non gerarchici troviamo

Risposta:

l'algoritmo Two-steps

267-Domanda:

La prima tabella da considerare nei risultati di una cluster analysis è quella contenente

Risposta:

le statistiche descrittive

268-Domanda:

La tabella di appartenenza cluster è formata da

Risposta:

numero di caso, clustr, distanza

269-Domanda:

Il grafico riportato nell'analisi è detto

Risposta:

dendogramma

270-Domanda:

Le politiche di miglioramento si rendono necessarie per effetto

Risposta:

della globalizzazione e della ipercompetizione

271-Domanda:

Il sistema di Gestione per la Qualità, tra le altre cose, consente

Risposta:

di misurare i diversi scostamenti rispetto al sistema delle aspettative della clientela

272-Domanda:

Vision 2000 ha introdotto il paradigma

Risposta:

della strategia

273-Domanda:

Il miglioramento della qualità riguarda

Risposta:

prodotti, servizi, processi

274-Domanda:

Il ciclo di Deming si caratterizza per

Risposta:

la dinamicità

275-Domanda:

La fase Check nella ruota di Deming consiste nel

Risposta:

verificare le soluzioni provate

276-Domanda:

La Ruota di Deming può essere chiamata anche

Risposta:

ciclo PDCA

277-Domanda:

Gli strumenti manageriali della qualità sono

Risposta:

7

278-Domanda:

E' uno strumento manageriale della qualità

Risposta:

l'istogramma

279-Domanda:

Gli strumenti manageriali della qualità

Risposta:

sono facili da usare

280-Domanda:

Le tecniche statistiche consentono di acquisire informazioni su un sistema o un processo in modo

Risposta:

razionale, ordinato, efficiente

281-Domanda:

L'evoluzione delle metodologie di valutazione ha visto il passaggio da

Risposta:

un'ottica di produzione ad un'ottica di mercato

282-Domanda:

Può prevedere una parte comune rispetto alla raccolta dati

Risposta:

il foglio di rilevazione

283-Domanda:

Nel diagramma causa-effetto, la testa del pesce rappresenta

Risposta:

l'effetto indesiderato

284-Domanda:

L'istogramma, quale strumento manageriale della qualità, si fonda sui concetti di

Risposta:

frequenza, dispersione, classe

285-Domanda:

L'analisi di Pareto si basa sul presupposto

Risposta:

80:20

286-Domanda:

Lo strumento manageriale della qualità che consente di verificare l'esistenza di differenze tra gruppi di dati omogenei è

Risposta:

l'analisi di stratificazione

287-Domanda:

Le carte di controllo prevedono riferiment

Risposta:

alla statistica inferenziale

288-Domanda:

Nel diagramma di correlazione, in caso di correlazione inversa

Risposta:

i punti si dispongono in modo decrescente lungo una retta

289-Domanda:

Lo strumento manageriale della qualità che consente di visualizzare cause principali e secondarie di un effetto indesiderato è

Risposta:

il diagramma causa-effetto

290-Domanda:

Shewhart distingue due tipologie di variabilità

Risposta:

variabilità sistematica e variabilità dovuta a cause identificabili

291-Domanda:

Shewhart aveva come obiettivo quello di offrire uno strumento capace di stabilire se un processo fosse

Risposta:

sotto o fuori controllo

292-Domanda:

Tra i principali benefici delle carte di controllo troviamo

Risposta:

il grado di affidabilità e stabilità di un sistema di controllo

293-Domanda:

Per ottenere i dati necessari ad elaborare la carta di controllo di Shewhart, il processi viene campionato a intervalli

Risposta:

regolari

294-Domanda:

I parametri dei sottogruppi sono ricavati principalmente con il metodo che

Risposta:

usa parametri stimati e aggiustati a man mano che il processo continua

295-Domanda:

Per la costruzione dell'UCL viene utilizzata la seguente formula

Risposta:

UCL = µw + L σw

296-Domanda:

Nelle formule di calcolo dei limiti, la L rappresenta

Risposta:

la distanza dei limiti di controllo dalla linea centrale espressa in unità di deviazione standard

297-Domanda:

Il rischio di un errore di II specie dipende da

Risposta:

ampiezza dei limiti di controllo, entità del processo fuori controllo e numerosità del campione

298-Domanda:

Nel momento in cui si verifica un evento che fa scattare l'allarme, si attivano una serie di attività che possono essere riassunte da

Risposta:

OCAP-Out of Control Plan

299-Domanda:

Il metodo di Shewhart tiene in considerazione solo l'errore di I specie e l'ammontare di tale errore è

Risposta:

0,3% con i limiti 3σ

300-Domanda:

Il programma che permette di avviare Jupyter Notebook tramite interfaccia grafica è

Risposta:

anaconda navigator

301-Domanda:

Una cella in Jupyter Notebook rappresenta

Risposta:

una unità per scrivere ed eseguire codice o testo formattato

302-Domanda:

Lo strumento che non è incluso in Anaconda è

Risposta:

excel

303-Domanda:

Il comando utilizzato per visualizzare le prime righe di un DataFrame è

Risposta:

df.head()

304-Domanda:

La libreria pensata per l'analisi e la manipolazione di dataset tabulari è

Risposta:

pandas

305-Domanda:

Il comando pd.cut() serve per

Risposta:

crea categorie da valori numerici

306-Domanda:

La libreria basata su Matplotlib che consente visualizzazioni statistiche avanzate è

Risposta:

seaborn

307-Domanda:

La funzione df.describe() restituisce

Risposta:

fornisce statistiche descrittive delle variabili numeriche

308-Domanda:

Un valore vicino a -1 nella correlazione indica

Risposta:

-1

309-Domanda:

Per eseguire una cella in Jupyter Notebook si utilizza

Risposta:

cltr + invio

310-Domanda:

La statistica descrittiva esprime

Risposta:

le caratteristiche e le proprietà dei dati

311-Domanda:

Indicare uno degli indicatori di tendenza centrale

Risposta:

moda

312-Domanda:

La media è influenzata da

Risposta:

gli outlier

313-Domanda:

La deviazione standard è

Risposta:

la variabilità dei dati rispetto alla media

314-Domanda:

La deviazione standard si calcola

Risposta:

calcolando la radice quadrata della varianza

315-Domanda:

Il valore 0.97 nella matrice di correlazione indica

Risposta:

correlazione positiva molto forte

316-Domanda:

La funzione di Pandas che restituisce un riepilogo statistico delle variabili numeriche è

Risposta:

df.describe()

317-Domanda:

Il valore che viene mostrato tra i quartili nel comando df.describe() è

Risposta:

mediana

318-Domanda:

Le variabili categoriche rappresentano

Risposta:

dati qualitativi suddivisi in classi

319-Domanda:

Il comando Pandas che mostra i nomi delle colonne di un DataFrame

Risposta:

df.columns

320-Domanda:

L'EDA (Exploratory Data Analysis) è

Risposta:

il processo di analisi iniziale dei dati per comprenderne struttura e pattern

321-Domanda:

Il comando Pandas per visualizzare le prime righe di un DataFrame è

Risposta:

df.head()

322-Domanda:

Il comando df.duplicated().sum() serve per

Risposta:

contare le righe duplicate

323-Domanda:

Un boxplot rappresenta

Risposta:

la distribuzione di una variabile numerica con mediana, quartili e outlier

324-Domanda:

La funzione df.hist() viene usata per

Risposta:

generare istogrammi per tutte le colonne numeriche

325-Domanda:

Un outlier è

Risposta:

un valore estremamente distante dagli altri

326-Domanda:

Il comando sns.countplot() serve a

Risposta:

visualizzare la frequenza delle categorie di una variabile

327-Domanda:

Il pairplot di Seaborn consente di

Risposta:

esplorare le relazioni tra coppie di variabili

328-Domanda:

Una fase importante dell'EDA è

Risposta:

pulizia dei dati e identificazione dei pattern

329-Domanda:

La variabile target nel dataset del diabete è

Risposta:

outcome

330-Domanda:

La regressione lineare permette di analizzare la relazione tra quali tipi di variabili

Risposta:

variabili quantitative

331-Domanda:

La retta di regressione minimizza

Risposta:

la somma dei quadrati degli errori

332-Domanda:

Nel dataset pubblicitario ci sono

Risposta:

tv, radio e giornali

333-Domanda:

Nella regressione semplice si usa una sola variabile indipendente per prevedere

Risposta:

una variabile dipendente

334-Domanda:

La funzione linearregression() appartiene alla libreria

Risposta:

sklearn

335-Domanda:

L'r quadro (r²) indica

Risposta:

la bontà dell'adattamento del modello ai dati

336-Domanda:

Il coefficiente angolare della retta di regressione rappresenta

Risposta:

la variazione prevista della variabile dipendente per unità di x

337-Domanda:

La variabile con la correlazione lineare più alta è

Risposta:

budget per tv

338-Domanda:

La variabile target nella regressione lineare è chiamata

Risposta:

variabile dipendente

339-Domanda:

Quando l'r quadro è vicino a 1 significa che

Risposta:

il modello spiega bene la variabilità dei dati

340-Domanda:

La regressione lineare multipla consente di modellare la relazione tra una variabile target e più variabili predittive

Risposta:

stimando una retta in uno spazio multidimensionale

341-Domanda:

Il coefficiente di determinazione r² assume valori compresi tra 0 e 1 e indica

Risposta:

la frazione di variabilità della variabile dipendente spiegata dal modello

342-Domanda:

Il coefficiente di una variabile in un modello di regressione lineare multipla rappresenta

Risposta:

la variazione attesa della variabile target per ogni unità di aumento del predittore, mantenendo costanti gli altri

343-Domanda:

Un valore di r² molto alto in fase di addestramento e basso in fase di test può indicare

Risposta:

overfitting del modello

344-Domanda:

Il metodo train_test_split della libreria Scikit-learn viene utilizzato per

Risposta:

suddividere il dataset in insiemi di addestramento e test

345-Domanda:

Un residuo rappresenta

Risposta:

la differenza tra il valore osservato e quello previsto dal modello

346-Domanda:

La presenza di un pattern nei residui indica spesso che

Risposta:

il modello non ha catturato completamente la relazione tra le variabili

347-Domanda:

L'intercetta in un modello di regressione lineare rappresenta

Risposta:

il valore previsto della variabile target quando tutti i predittori sono nulli

348-Domanda:

La funzione LinearRegression della libreria Scikit-learn serve per

Risposta:

definire un modello di regressione lineare da addestrare su un dataset

349-Domanda:

Il comando model.coef_ in Scikit-learn restituisce

Risposta:

i coefficienti associati a ciascun predittore

350-Domanda:

Il machine learning è

Risposta:

un sottoinsieme dell'intelligenza artificiale che apprende dai dati

351-Domanda:

Il deep learning è

Risposta:

un sottoinsieme del machine learning basato su reti neurali profonde

352-Domanda:

Un algoritmo supervisionato utilizza

Risposta:

dati di input con output noti per apprendere

353-Domanda:

Il clustering è un esempio di

Risposta:

apprendimento non supervisionato che cerca pattern

354-Domanda:

Una feature nel machine learning è

Risposta:

una caratteristica misurabile del dato in input

355-Domanda:

Il principio garbage in, garbage out implica che

Risposta:

dati non puliti generano risultati poco affidabili

356-Domanda:

La scelta del modello in ML richiede

Risposta:

una procedura iterativa tra accuratezza, velocità e spiegabilità

357-Domanda:

Le hand-crafted features sono

Risposta:

feature costruite manualmente da chi sviluppa il modello

358-Domanda:

Un vantaggio dei modelli semplici è che

Risposta:

sono più facilmente interpretabili

359-Domanda:

Il machine learning è utile quando

Risposta:

le relazioni tra le variabili non sono note o modellabili

360-Domanda:

Nel contesto del machine learning, per classificazione si intende

Risposta:

predire a quale di un insieme di classi appartiene un esempio

361-Domanda:

La differenza principale tra classificazione e regressione consiste in

Risposta:

l'output di un classificatore è una classe, quello di un regressore un numero reale

362-Domanda:

Per classificazione binaria si intende

Risposta:

un problema con due possibili classi (es. spam vs non-spam)

363-Domanda:

Nell'apprendimento supervisionato, la funzione ipotesi h(x)h(x)h(x) serve a

Risposta:

approssimare la funzione incognita f(x)f(x)f(x) che collega input e output

364-Domanda:

Tra i seguenti, NON è un algoritmo di classificazione

Risposta:

principal pomponent analysis (PCA)

365-Domanda:

Una fase del processo di classificazione è

Risposta:

validazione

366-Domanda:

In una matrice di confusione, cosa rappresenta FP

Risposta:

istanza positiva classificata correttamente

367-Domanda:

Quale definizione descrive l'accuratezza di un classificatore

Risposta:

numero di previsioni corrette diviso il totale delle previsioni

368-Domanda:

La formula del richiamo (recall o TPR) è

Risposta:

TP / (TP + FN)

369-Domanda:

L'area sotto la curva ROC (AUC) rappresenta

Risposta:

la probabilità che un positivo casuale ottenga un punteggio di classificazione più alto di un negativo casuale

370-Domanda:

L'aspetto che si deve tenere in considerazione prima di applicare un modello di machine learning

Risposta:

qualità dei dati

371-Domanda:

Il vettore di feature rappresenta

Risposta:

array numerico di feature

372-Domanda:

Cosa si usa per visualizzare i dati dopo il binning

Risposta:

istogramma

373-Domanda:

Un valore anomalo (outlier) è definito come un dato che

Risposta:

si discosti significativamente dalla distribuzione

374-Domanda:

La normalizzazione Min-Max serve a

Risposta:

riportare i valori in [0,1]

375-Domanda:

La standardizzazione Z-score garantisce che le feature abbiano

Risposta:

mediana zero

376-Domanda:

Il binning equal-frequency suddivide i dati in bin con

Risposta:

stesso numero di osservazioni

377-Domanda:

Nel feature engineering lo scaling aiuta a

Risposta:

ridurre il numero di campioni

378-Domanda:

Quale libreria Python fornisce sia MinMaxScaler che StandardScaler

Risposta:

scikit-learn

379-Domanda:

Lo z score si calcola a partire da

Risposta:

media e devizione standard delle x

380-Domanda:

Una feature è

Risposta:

una proprietà misurabile di ogni esempio del dataset

381-Domanda:

In un dataset tabellare le righe e le colonne rappresentano

Risposta:

ogni riga è un esempio e ogni colonna è una feature

382-Domanda:

I tipi di dati possibili presenti in un dataset sono

Risposta:

dati numerici, categorici, linguaggio umano, multimediali ed embedding

383-Domanda:

Le sottocategorie principali delle feature categoriche sono

Risposta:

nominali e ordinali

384-Domanda:

Un feature vector è

Risposta:

un array di valori numerici derivati dalle feature trasformate

385-Domanda:

L'espressione garbage in-garbage out signifca

Risposta:

se i dati in ingresso sono di scarsa qualità il modello darà risultati inaffidabili

386-Domanda:

Secondo la regola empirica, rispetto ai parametri da addestrare si devono avere un numero di esempi pari a

Risposta:

almeno dieci volte il numero di parametri

387-Domanda:

Cosa si intende per classe di minoranza in un dataset sbilanciato

Risposta:

la classe meno rappresentata nel dataset

388-Domanda:

Perché si separa un dataset in train e test

Risposta:

per stimare la capacità di generalizzazione su dati mai visti

389-Domanda:

L'overfitting è

Risposta:

quando un modello apprende rumore anziché pattern generali

390-Domanda:

La classificazione supervisionata è

Risposta:

una sotto-area del machine learning

391-Domanda:

Un filtro per capire se una mail è spam o no si basa su

Risposta:

modello di classificazione supervisionato

392-Domanda:

La suddivisione in train e test dataset si fa tipicamente in percentuali di

Risposta:

70-30

393-Domanda:

Al dataset di validation si assegna tipicamente una percentuale di

Risposta:

10

394-Domanda:

La regressione logistica si basa sulla funzione

Risposta:

logit

395-Domanda:

Il random forest deriva dall'algoritmo

Risposta:

decision tree

396-Domanda:

il comando confusion_matrix(y_test, y_pred) si usa per

Risposta:

visualizzare la matrice di confusione

397-Domanda:

Per calcolare l'accuratezza in python si usa

Risposta:

model.score

398-Domanda:

Per standardizzare un dataset fra 0 e 1 si usa la funzione

Risposta:

scaler.transform

399-Domanda:

Un valore di accuratezza vicino ad 1 calcolato sul training set suggerisce che

Risposta:

ci potrebbe essere overfitting

400-Domanda:

Le cellule del sistema nervoso umano sono in grado di elaborare

Risposta:

segnali elettrici

401-Domanda:

Il neurone decide di attivarsi grazie a

Risposta:

la funzione di spike

402-Domanda:

Nel contesto di apprendimento un'epoca è

Risposta:

un passaggio completo nel dataset di train

403-Domanda:

Utilizzare batch piccole permette di

Risposta:

ridurre la memoria necessaria

404-Domanda:

La funzione di perdita indica

Risposta:

minimizza la distanza fra il valore predetto e quello reale

405-Domanda:

Problemi di divergenza nel dataset sono causati da

Risposta:

batch troppo grande

406-Domanda:

Le funzioni di attivazione

Risposta:

inotroducono non linearità nel dataset

407-Domanda:

La funzione di attivazione tanh permette di

Risposta:

produrre un output compreso fra -1 e 1

408-Domanda:

In python, hidden_layer_sizes=(50, 30) significa che

Risposta:

il primo layer ha 50 neuroni, il secondo 30

409-Domanda:

Un valore di accuracy pari a 0.97 significa che

Risposta:

il modello ha indovinato il 97% delle predizioni

410-Domanda:

Il deep learning si basa su

Risposta:

un'evoluzione delle reti neurali

411-Domanda:

Il Multilayer Perceptron

Risposta:

si compone di uno strato si input, uno o più strati nascosti e uno strato di output

412-Domanda:

Per rilevare pattern come bordi o forme è meglio usare

Risposta:

CNN

413-Domanda:

I dati sequenziali vengono gestiti meglio dai

Risposta:

RNN

414-Domanda:

Le porte di reset e update sono tipiche di

Risposta:

GRU

415-Domanda:

IL gradient descent è

Risposta:

un metodo di ottimizzazione

416-Domanda:

La funzione train_test_split in python serve per

Risposta:

dividere in dataset di train e test

417-Domanda:

Per importare in python MLPClassifier bisogna usare la libreria

Risposta:

sklearn.neural_network

418-Domanda:

Le configurazioni di reti più complesse

Risposta:

non sempre garantiscono il risultato migliore

419-Domanda:

Per eseguire il training di una rete in python si usa il comando

Risposta:

model.fit