import csv

age = []
sex = []
bmi = []
children = []
smoker = []
region = []
charges = []

with open('insurance.csv') as insurance:
    medical_records = csv.DictReader(insurance)
    for row in medical_records:
        age.append(row['age'])
        sex.append(row['sex'])
        bmi.append(row['bmi'])
        children.append(row['children'])
        smoker.append(row['smoker'])
        region.append(row['region'])
        charges.append(row['charges'])


region_count = {}

for item in region:
    if item in region_count.keys():
        region_count[item] += 1
    else:
        region_count[item] = 1

print(region_count)

{'southwest': 325, 'southeast': 364, 'northwest': 325, 'northeast': 324}


regions_and_charges = list(zip(region,charges))
charges_by_region = {}

for item in regions_and_charges:
    r = item[0]
    c = float(item[1])
    if r in charges_by_region.keys():
        charges_by_region[r] += c
    else:
        charges_by_region[r] = c
        
average_charge_by_region = {}

for area in region_count.keys():
    average = charges_by_region[area]/region_count[area]
    average_charge_by_region[area] = round(average,2)

print(average_charge_by_region)

{'southwest': 12346.94, 'southeast': 14735.41, 'northwest': 12417.58, 'northeast': 13406.38}


regions_and_ages = list(zip(region,age))
age_by_region = {}

for item in regions_and_ages:
    r = item[0]
    a = int(item[1])
    if r in age_by_region.keys():
        age_by_region[r] += a
    else:
        age_by_region[r] = a

average_age_by_region = {}
        
for area in region_count.keys():
    average = age_by_region[area]/region_count[area]
    average_age_by_region[area] = round(average,1)

print(average_age_by_region)

{'southwest': 39.5, 'southeast': 38.9, 'northwest': 39.2, 'northeast': 39.3}


regions_and_sex = list(zip(region,sex))
females_by_region = {}

for item in regions_and_sex:
    r = item[0]
    s = item[1]
    if r in females_by_region.keys():
        if s == 'female':
            females_by_region[r] += 1
    else:
        if s == 'female':
            females_by_region[r] = 1

female_percentage_by_region = {}

for area in females_by_region.keys():
    females = 100 * females_by_region[area] / region_count[area]
    female_percentage_by_region[area] = round(females,2)

print(female_percentage_by_region)

{'southwest': 49.85, 'southeast': 48.08, 'northwest': 50.46, 'northeast': 49.69}


regions_and_bmi = list(zip(region,bmi))
bmi_by_region = {}

for item in regions_and_bmi:
    r = item[0]
    b = float(item[1])
    if r in bmi_by_region.keys():
        bmi_by_region[r] += b
    else:
        bmi_by_region[r] = b
        
average_bmi_by_region = {}

for area in region_count.keys():
    average = bmi_by_region[area]/region_count[area]
    average_bmi_by_region[area] = round(average,2)

print(average_bmi_by_region)

{'southwest': 30.6, 'southeast': 33.36, 'northwest': 29.2, 'northeast': 29.17}


regions_and_children = list(zip(region,children))
children_by_region = {}

for item in regions_and_children:
    r = item[0]
    a = int(item[1])
    if r in children_by_region.keys():
        children_by_region[r] += a
    else:
        children_by_region[r] = a

average_children_by_region = {}
        
for area in region_count.keys():
    average = children_by_region[area]/region_count[area]
    average_children_by_region[area] = round(average,1)

print(average_children_by_region)

{'southwest': 1.1, 'southeast': 1.0, 'northwest': 1.1, 'northeast': 1.0}


regions_and_smokers = list(zip(region,smoker))
smokers_by_region = {}

for item in regions_and_smokers:
    r = item[0]
    s = item[1]
    if r in smokers_by_region.keys():
        if s == 'yes':
            smokers_by_region[r] += 1
    else:
        if s == 'yes':
            smokers_by_region[r] = 1

smokers_percentage_by_region = {}

for area in females_by_region.keys():
    smokers = 100 * smokers_by_region[area] / region_count[area]
    smokers_percentage_by_region[area] = round(smokers,2)

print(smokers_percentage_by_region)

{'southwest': 17.85, 'southeast': 25.0, 'northwest': 17.85, 'northeast': 20.68}

How location affects US medical insurance costs¶

Introduction¶

Analysing insurance costs by location¶

Average age by region¶

Percentage of females by region¶

BMI by region¶

Number of children by region¶

Percentage of smokers by region¶

Conclusion¶