From fc961233f96a992a819eb2feeaad57a5242a65d2 Mon Sep 17 00:00:00 2001
From: Jun-te Kim <junte.kim@mealcraft.com>
Date: Tue, 17 Feb 2026 11:36:24 +0000
Subject: [PATCH 1/3] only run on pull request

---
 .github/workflows/unit_tests.yml | 5 -----
 1 file changed, 5 deletions(-)

diff --git a/.github/workflows/unit_tests.yml b/.github/workflows/unit_tests.yml
index 2ad16b97..cc6431b8 100644
--- a/.github/workflows/unit_tests.yml
+++ b/.github/workflows/unit_tests.yml
@@ -1,11 +1,6 @@
 name: Run unit tests
 
 on:
-  push:
-    branches:
-      - "main"
-      - "dev"
-      - "prod"
   pull_request:
     branches:
       - "**"

From 546cc2a58f6596750ae5330aa5d088dc1ed5f690 Mon Sep 17 00:00:00 2001
From: Jun-te Kim <junte.kim@mealcraft.com>
Date: Wed, 18 Feb 2026 12:17:23 +0000
Subject: [PATCH 2/3] added lambda in parrael code

---
 asset_list/AssetList.py                       | 2728 +++++++++++------
 asset_list/app.py                             |   64 +-
 asset_list/requirements.txt                   |    2 +-
 .../terraform/lambda/_template/main.tf        |    2 +
 .../terraform/lambda/_template/variables.tf   |    5 +
 .../terraform/lambda/address2UPRN/main.tf     |    3 +
 .../lambda/address2UPRN/variables.tf          |    5 +
 .../lambda/modules/lambda_with_sqs/main.tf    |    3 +-
 .../modules/lambda_with_sqs/variables.tf      |    6 +
 .../modules/lambda_sqs_trigger/main.tf        |    7 +
 .../modules/lambda_sqs_trigger/variables.tf   |    6 +
 11 files changed, 1852 insertions(+), 979 deletions(-)

diff --git a/asset_list/AssetList.py b/asset_list/AssetList.py
index 36b3d58e..28e17e2a 100644
--- a/asset_list/AssetList.py
+++ b/asset_list/AssetList.py
@@ -25,21 +25,25 @@ import asset_list.mappings.outcomes as outcomes_mappings
 from recommendations.recommendation_utils import (
     estimate_perimeter,
     estimate_external_wall_area,
-    estimate_number_of_floors
+    estimate_number_of_floors,
 )
 
 from etl.epc_clean.epc_attributes.RoofAttributes import RoofAttributes
 from etl.epc_clean.epc_attributes.WallAttributes import WallAttributes
 
+from dotenv import load_dotenv
+
 logger = setup_logger()
+load_dotenv(dotenv_path="../backend/.env")
+
 
 # OpenAI API Key (set this in your environment variables for security)
-OPENAI_API_KEY = os.environ.get("OPENAI_API_KEY")
-
+OPENAI_API_KEY = os.environ.get("OPENAI_API_KEY", "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")
 
 
 class DataRemapper:
     def __init__(self, standard_values, standard_map=None, max_tokens=1000):
+        print(f"{OPENAI_API_KEY}")
         """
         Initialize the remapper with standard values and a predefined mapping.
 
@@ -61,7 +65,9 @@ class DataRemapper:
         self.max_tokens = max_tokens  # Limit for OpenAI API
 
         # Memoization for AI calls
-        self.ai_cache = {}  # {tuple(unmapped_values): {original_value: standardized_value}}
+        self.ai_cache = (
+            {}
+        )  # {tuple(unmapped_values): {original_value: standardized_value}}
         # Capture the reponse for debugging
         self.ai_response = None
 
@@ -79,14 +85,16 @@ class DataRemapper:
         if not isinstance(text, str):
             return None
         text = text.strip().lower()
-        text = re.sub(r'[^\w\s]', '', text)  # Remove punctuation
+        text = re.sub(r"[^\w\s]", "", text)  # Remove punctuation
         # Replace double strings
-        text = re.sub(r'\s+', ' ', text)
+        text = re.sub(r"\s+", " ", text)
         return text
 
     def fuzzy_match(self, text):
         """Use fuzzy matching to find the closest standard value."""
-        match, score = process.extractOne(text, self.standard_values) if text else (None, 0)
+        match, score = (
+            process.extractOne(text, self.standard_values) if text else (None, 0)
+        )
         return match if score >= self.fuzzy_threshold else None
 
     def count_tokens(self, text):
@@ -98,7 +106,9 @@ class DataRemapper:
         if not unmapped_values:
             return {}
 
-        unmapped_tuple = tuple(sorted(unmapped_values))  # Ensure consistency for memoization
+        unmapped_tuple = tuple(
+            sorted(unmapped_values)
+        )  # Ensure consistency for memoization
         if unmapped_tuple in self.ai_cache:
             return self.ai_cache[unmapped_tuple]  # Return memoized result
 
@@ -180,7 +190,9 @@ class DataRemapper:
             # Rule-Based Check (Predefined Mapping)
             if cleaned_value in self.standard_map or value in self.standard_map:
                 self.remap_dict[value] = (
-                    self.standard_map[cleaned_value] if cleaned_value in self.standard_map else self.standard_map[value]
+                    self.standard_map[cleaned_value]
+                    if cleaned_value in self.standard_map
+                    else self.standard_map[value]
                 )
                 continue
 
@@ -237,22 +249,22 @@ class AssetList:
         "roof-description": "epc_roof_construction",
         "floor-description": "epc_floor_construction",
         "mainheat-description": "epc_heating_type",
-        'mainheatcont-description': "epc_heating_controls",
+        "mainheatcont-description": "epc_heating_controls",
         "secondheat-description": "epc_secondary_heating",
         "transaction-type": "epc_reason",
         "energy-consumption-current": "epc_heat_demand",
         "photo-supply": "epc_photo_supply",
-        "estimated": "estimated"
+        "estimated": "estimated",
     }
     FIND_EPC_DATA_NAMES = {
         "heating_text": "epc_estiamted_heating_kwh",
         "hot_water_text": "epc_estimated_hotwater_kwh",
-        'Assessor’s name': "epc_assessor_name",
+        "Assessor’s name": "epc_assessor_name",
         "Assessor's Telephone": "epc_assessor_telephone",
         "Assessor's Email": "epc_assessor_email",
         "Accreditation scheme": "epc_assessor_accreditation",
         "Assessor’s ID": "epc_assessor_id",
-        "Solar photovoltaics": "epc_solar_pv"
+        "Solar photovoltaics": "epc_solar_pv",
     }
 
     DATETIME_REMAP = {
@@ -286,44 +298,69 @@ class AssetList:
     DOMNA_PROPERTY_ID = "domna_property_id"
 
     # Regular expression for identifying if the address might point to multiple units
-    MULTI_UNIT_REGEX = re.compile(r'\b([A-Za-z0-9]+)-([A-Za-z0-9]+)\b')
+    MULTI_UNIT_REGEX = re.compile(r"\b([A-Za-z0-9]+)-([A-Za-z0-9]+)\b")
 
     # List of columns relating to the non-intrusive data
     NON_INTRUSIVES_COLNAMES = [
-        "Archetype", "Construction", "Insulated", "Material", "CIGA Check Required",
-        "PV, ACCESS ISSUE, SEE NOTES", "OFF GAS - ROOF ORIENTATION",
-        "Any further surveyor notes", 'Surveyors Name'
+        "Archetype",
+        "Construction",
+        "Insulated",
+        "Material",
+        "CIGA Check Required",
+        "PV, ACCESS ISSUE, SEE NOTES",
+        "OFF GAS - ROOF ORIENTATION",
+        "Any further surveyor notes",
+        "Surveyors Name",
     ]
 
     NON_INTRUSIVES_NEW_FORMAT_COLNAMES = [
-        "Has the property been re-walled?", "Is the property tile hung?", "Does the property have a render?",
-        "Does the property have cladding?", "Gable Wall Obstructions",
+        "Has the property been re-walled?",
+        "Is the property tile hung?",
+        "Does the property have a render?",
+        "Does the property have cladding?",
+        "Gable Wall Obstructions",
         "Does the property have foliage that needs removal?",
-        "Potential unsafe environment", "Date of Inspection", "Borescoped?"
+        "Potential unsafe environment",
+        "Date of Inspection",
+        "Borescoped?",
     ]
 
     # Another version of non-intrusives:
     NON_INTRUSIVES_NEW_FORMAT_COLNAMES_V2 = [
-        'Archetype', 'Archetype 2', 'Construction', 'Insulated', 'Material', 'Borescoped?',
-        'CIGA Check Required', 'ROOF ORIENTATION', 'TILE HUNG', 'RENDERED',
-        'CLADDING', 'ACCESS ISSUES', 'FURTHER SURVEYOR NOTES', 'DATE',
-        'NAME OF SURVEYOR'
+        "Archetype",
+        "Archetype 2",
+        "Construction",
+        "Insulated",
+        "Material",
+        "Borescoped?",
+        "CIGA Check Required",
+        "ROOF ORIENTATION",
+        "TILE HUNG",
+        "RENDERED",
+        "CLADDING",
+        "ACCESS ISSUES",
+        "FURTHER SURVEYOR NOTES",
+        "DATE",
+        "NAME OF SURVEYOR",
     ]
 
     # Solar non-intrusive fields
     NON_INTRUSIVES_SOLAR_COLNAMES = [
-        'PV, ACCESS ISSUE, SEE NOTES', 'ROOF ORIENTATION',
-        'AREA (m²) OF ROOF WHERE PV WILL BE SITUATED ', 'SHADING',
-        'Roof Tiles - CONCRETE/SLATE/ROSEMARY',
-        'NO. OF PANELS     (Typical size of 420W panel is 1mx1.7m and need 30cm all the way around panels)',
-        'SCAFFOLD REQUIRED?   IF YES, ARE THERE ANY SURROUNDING ACCESS ISSUES - PLEASE DESCRIBE',
-        'IF PANELS ARE GOING ON REAR PLEASE CHECK FOR SPACE FOR SCAFFOLDING - DESCRIBE ANY ISSUES BELOW',
-        'DATE', 'NAME OF SURVEYOR'
+        "PV, ACCESS ISSUE, SEE NOTES",
+        "ROOF ORIENTATION",
+        "AREA (m²) OF ROOF WHERE PV WILL BE SITUATED ",
+        "SHADING",
+        "Roof Tiles - CONCRETE/SLATE/ROSEMARY",
+        "NO. OF PANELS     (Typical size of 420W panel is 1mx1.7m and need 30cm all the way around panels)",
+        "SCAFFOLD REQUIRED?   IF YES, ARE THERE ANY SURROUNDING ACCESS ISSUES - PLEASE DESCRIBE",
+        "IF PANELS ARE GOING ON REAR PLEASE CHECK FOR SPACE FOR SCAFFOLDING - DESCRIBE ANY ISSUES BELOW",
+        "DATE",
+        "NAME OF SURVEYOR",
     ]
 
     NON_INTRUSIVES_ELIGIBILITY_COLUMN = "Eligibility (Red/Yellow/Green)"
 
-    OLD_FORMAT_NON_INTRUSIVE_COLNAMES = ['WFT Findings', 'ECO Eligibility']
+    OLD_FORMAT_NON_INTRUSIVE_COLNAMES = ["WFT Findings", "ECO Eligibility"]
 
     # This SAP threshold is a key search criteria for properties that may be eligible for extraction
     FILLED_CAVITY_SAP_THRESHOLD = 75
@@ -341,7 +378,9 @@ class AssetList:
     ATTRIBUTE_ESTIMATED_PERIMETER = "attribute_est_perimter"
     ATTRIBUTE_HEAT_LOSS_AREA = "attribute_heat_loss_area"
     ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS = "attribute_epc_roof_insulation_thickness"
-    ATTRIBUTE_SAP_THRESHOLD_AND_BELOW = f"sap_rating_{FILLED_CAVITY_SAP_THRESHOLD}_and_below"
+    ATTRIBUTE_SAP_THRESHOLD_AND_BELOW = (
+        f"sap_rating_{FILLED_CAVITY_SAP_THRESHOLD}_and_below"
+    )
     ATTRIBUTE_EPC_PRE_YEAR_THRESHOLD = f"epc_is_pre_{EPC_YEAR_THRESHOLD}"
 
     # These are the descriptions that we look for in the EPC data that are indicative of no insulation
@@ -354,12 +393,17 @@ class AssetList:
 
     # List of strings that we look for in the EPC data, where substrings indicate that the wall is insulated
     EPC_INSULATED_WALLS_SUBSTRINGS = [
-        ", insulated", "with external insulation", "with internal insulation", "filled cavity"
+        ", insulated",
+        "with external insulation",
+        "with internal insulation",
+        "filled cavity",
     ]
 
     # List of strings that we look for in the EPC data, where substrings indicate that the roof is insulated
     EPC_INSULATED_ROOF_SUBSTRINGS = [
-        "(another dwelling above)", ", insulated", ", insulated (assumed) ",
+        "(another dwelling above)",
+        ", insulated",
+        ", insulated (assumed) ",
         ", ceiling insulated",
     ]
 
@@ -374,35 +418,69 @@ class AssetList:
     # Work type prefixes:
     # Empties
     EMPTY_CAVITY_NON_INTRUSIVE = "Non-Intrusive Data Shows Empty Cavity"
-    EMPTY_CAVITY_NON_INTRUSIVE_YEAR = 'Non-Intrusive Data Shows Empty Cavity, built after 2002'
-    EPC_EMPTY_INSPECTIONS_RETRO_DRILLED = "EPC Shows Empty Cavity, inspections show retro drilled"
-    EPC_EMPTY_INSPECTIONS_FILLED = "EPC Shows Empty Cavity, inspections show filled or other"
-    EPC_EMPTY_INSPECTIONS_FILLED_AT_BUILD = "EPC Shows Empty Cavity, inspections show filled at build"
-    EPC_EMPTY_INSPECTIONS_NON_CAVITY = "EPC Shows Empty Cavity, inspections show non-cavity build"
+    EMPTY_CAVITY_NON_INTRUSIVE_YEAR = (
+        "Non-Intrusive Data Shows Empty Cavity, built after 2002"
+    )
+    EPC_EMPTY_INSPECTIONS_RETRO_DRILLED = (
+        "EPC Shows Empty Cavity, inspections show retro drilled"
+    )
+    EPC_EMPTY_INSPECTIONS_FILLED = (
+        "EPC Shows Empty Cavity, inspections show filled or other"
+    )
+    EPC_EMPTY_INSPECTIONS_FILLED_AT_BUILD = (
+        "EPC Shows Empty Cavity, inspections show filled at build"
+    )
+    EPC_EMPTY_INSPECTIONS_NON_CAVITY = (
+        "EPC Shows Empty Cavity, inspections show non-cavity build"
+    )
     EPC_EMPTY = "EPC Shows Empty Cavity"
-    LANDLORD_EMPTY_INSPECTIONS_OTHER = ("Landlord Data Shows Empty Cavity, EPC & Inspections Shows Filled or "
-                                        "Non-cavity")
+    LANDLORD_EMPTY_INSPECTIONS_OTHER = (
+        "Landlord Data Shows Empty Cavity, EPC & Inspections Shows Filled or "
+        "Non-cavity"
+    )
     # Extraction
     EXTRACTION_NON_INTRUSIVE = "Non-Intrusive Data Shows Cavity Extraction"
 
     # Solar
     SOLAR_ELIGIBLE = "Solar Eligible"
-    SOLAR_ELIGIBLE_SOLID_WALL_UNINSULATED = "Solar Eligible, Solid Wall Uninsulated, EPC E or Below"
+    SOLAR_ELIGIBLE_SOLID_WALL_UNINSULATED = (
+        "Solar Eligible, Solid Wall Uninsulated, EPC E or Below"
+    )
     SOLAR_ELIGIBLE_NEEDS_HEATING_UPGRADE = "Solar Eligible, Needs Heating Upgrade"
 
     CRM_HISTORICAL_CAVITY_PRODUCT = {
-        "id": 156989182176, "unit_price": 0, "name": "Historical ECO Cavity"
+        "id": 156989182176,
+        "unit_price": 0,
+        "name": "Historical ECO Cavity",
     }
 
     CRM_PRODUCTS = {
-        "Empty Cavity - ECO4": {"id": 82733738177, "unit_price": 1000, "name": "Empty Cavity - ECO4"},
-        "Extract & Fill - ECO4": {"id": 100307905778, "unit_price": 500, "name": "Extract & Fill - ECO4"},
-        "Solar PV - ECO4": {"id": 82623589564, "unit_price": 1608, "name": "Solar PV - ECO4"},
-        "Solar PV + HHRSH - ECO4": {"id": 155529972924, "unit_price": 1608, "name": "Solar PV + HHRSH - ECO4"},
-        "Solar PV + Heating Upgrade - ECO4": {
-            "id": 109265426665, "unit_price": 1608, "name": "Solar PV + Heating Upgrade - ECO4"
+        "Empty Cavity - ECO4": {
+            "id": 82733738177,
+            "unit_price": 1000,
+            "name": "Empty Cavity - ECO4",
         },
-        "Historical ECO Cavity": CRM_HISTORICAL_CAVITY_PRODUCT
+        "Extract & Fill - ECO4": {
+            "id": 100307905778,
+            "unit_price": 500,
+            "name": "Extract & Fill - ECO4",
+        },
+        "Solar PV - ECO4": {
+            "id": 82623589564,
+            "unit_price": 1608,
+            "name": "Solar PV - ECO4",
+        },
+        "Solar PV + HHRSH - ECO4": {
+            "id": 155529972924,
+            "unit_price": 1608,
+            "name": "Solar PV + HHRSH - ECO4",
+        },
+        "Solar PV + Heating Upgrade - ECO4": {
+            "id": 109265426665,
+            "unit_price": 1608,
+            "name": "Solar PV + Heating Upgrade - ECO4",
+        },
+        "Historical ECO Cavity": CRM_HISTORICAL_CAVITY_PRODUCT,
     }
 
     def __init__(
@@ -427,13 +505,15 @@ class AssetList:
         landlord_sap=None,
         landlord_block_reference=None,
         phase=False,
-        header=0
+        header=0,
     ):
         self.local_filepath = local_filepath
         self.sheet_name = sheet_name
         # Read in the data
         if local_filepath.endswith(".xlsx"):
-            self.raw_asset_list = pd.read_excel(local_filepath, header=header, sheet_name=sheet_name)
+            self.raw_asset_list = pd.read_excel(
+                local_filepath, header=header, sheet_name=sheet_name
+            )
         else:
             self.raw_asset_list = pd.read_csv(local_filepath)
         self.standardised_asset_list = self.raw_asset_list.copy()
@@ -459,21 +539,31 @@ class AssetList:
         self.phase = phase
 
         # We detect the presence of the non-intrusive columns
-        self.non_intrusives_present = "CIGA Check Required" in self.raw_asset_list.columns
+        self.non_intrusives_present = (
+            "CIGA Check Required" in self.raw_asset_list.columns
+        )
         # We detect if we have the old format of non-intruvies
-        self.old_format_non_intrusives_present = "WFT Findings" in self.raw_asset_list.columns
+        self.old_format_non_intrusives_present = (
+            "WFT Findings" in self.raw_asset_list.columns
+        )
         if self.old_format_non_intrusives_present:
             self.non_intrusives_present = False
 
-        self.non_intrusives_eligibility = "Eligibility (Red/Yellow/Green)" in self.raw_asset_list.columns
+        self.non_intrusives_eligibility = (
+            "Eligibility (Red/Yellow/Green)" in self.raw_asset_list.columns
+        )
 
         self.new_format_non_insturives_present = (
             "Has the property been re-walled?" in self.raw_asset_list.columns
         )
 
-        self.new_format_non_insturives_present_v2 = 'TILE HUNG' in self.raw_asset_list.columns
+        self.new_format_non_insturives_present_v2 = (
+            "TILE HUNG" in self.raw_asset_list.columns
+        )
 
-        self.solar_non_intrusives_present = "AREA (m²) OF ROOF WHERE PV WILL BE SITUATED" in self.raw_asset_list.columns
+        self.solar_non_intrusives_present = (
+            "AREA (m²) OF ROOF WHERE PV WILL BE SITUATED" in self.raw_asset_list.columns
+        )
 
         # Names of columns
         self.landlord_property_id = landlord_property_id
@@ -500,7 +590,7 @@ class AssetList:
             "property_type": None,
             "wall_construction": None,
             "heating_system": None,
-            "existing_pv": None
+            "existing_pv": None,
         }
 
         self.variable_mappings = {}
@@ -510,8 +600,12 @@ class AssetList:
         self.keep_variables = []
 
         # Finally, we handle the case where the landlord's property ID is actually the OS UPRN
-        if (self.landlord_uprn == self.landlord_property_id) and (self.landlord_property_id is not None):
-            self.standardised_asset_list[self.STANDARD_UPRN] = self.standardised_asset_list[self.landlord_uprn].copy()
+        if (self.landlord_uprn == self.landlord_property_id) and (
+            self.landlord_property_id is not None
+        ):
+            self.standardised_asset_list[self.STANDARD_UPRN] = (
+                self.standardised_asset_list[self.landlord_uprn].copy()
+            )
             # Update the reference to landlord UPRn
             self.landlord_uprn = self.STANDARD_UPRN
 
@@ -558,41 +652,63 @@ class AssetList:
         self.prefixes_to_products = {
             # Empty
             self.EMPTY_CAVITY_NON_INTRUSIVE: self.CRM_PRODUCTS["Empty Cavity - ECO4"],
-            self.EPC_EMPTY_INSPECTIONS_RETRO_DRILLED: self.CRM_PRODUCTS["Empty Cavity - ECO4"],
+            self.EPC_EMPTY_INSPECTIONS_RETRO_DRILLED: self.CRM_PRODUCTS[
+                "Empty Cavity - ECO4"
+            ],
             self.EPC_EMPTY_INSPECTIONS_FILLED: self.CRM_PRODUCTS["Empty Cavity - ECO4"],
-            self.EPC_EMPTY_INSPECTIONS_FILLED_AT_BUILD: self.CRM_PRODUCTS["Empty Cavity - ECO4"],
-            self.EPC_EMPTY_INSPECTIONS_NON_CAVITY: self.CRM_PRODUCTS["Empty Cavity - ECO4"],
+            self.EPC_EMPTY_INSPECTIONS_FILLED_AT_BUILD: self.CRM_PRODUCTS[
+                "Empty Cavity - ECO4"
+            ],
+            self.EPC_EMPTY_INSPECTIONS_NON_CAVITY: self.CRM_PRODUCTS[
+                "Empty Cavity - ECO4"
+            ],
             self.EPC_EMPTY: self.CRM_PRODUCTS["Empty Cavity - ECO4"],
-            self.LANDLORD_EMPTY_INSPECTIONS_OTHER: self.CRM_PRODUCTS["Empty Cavity - ECO4"],
+            self.LANDLORD_EMPTY_INSPECTIONS_OTHER: self.CRM_PRODUCTS[
+                "Empty Cavity - ECO4"
+            ],
             # Extraction
             self.EXTRACTION_NON_INTRUSIVE: self.CRM_PRODUCTS["Extract & Fill - ECO4"],
             # Solar
             self.SOLAR_ELIGIBLE: self.CRM_PRODUCTS["Solar PV - ECO4"],
-            self.SOLAR_ELIGIBLE_SOLID_WALL_UNINSULATED: self.CRM_PRODUCTS["Solar PV - ECO4"],
-            self.SOLAR_ELIGIBLE_NEEDS_HEATING_UPGRADE: self.CRM_PRODUCTS["Solar PV + Heating Upgrade - ECO4"],
+            self.SOLAR_ELIGIBLE_SOLID_WALL_UNINSULATED: self.CRM_PRODUCTS[
+                "Solar PV - ECO4"
+            ],
+            self.SOLAR_ELIGIBLE_NEEDS_HEATING_UPGRADE: self.CRM_PRODUCTS[
+                "Solar PV + Heating Upgrade - ECO4"
+            ],
         }
 
-    def _extract_address1(self, asset_list, full_address_col, postcode_col, method="first_two_words"):
+    def _extract_address1(
+        self, asset_list, full_address_col, postcode_col, method="first_two_words"
+    ):
 
         if method not in self.ADDRESS_1_CLEANING_METHODS:
             raise ValueError(f"Method {method} for producing address1 not recognized")
 
         if method == "first_two_words":
-            asset_list[self.address1_colname] = asset_list[full_address_col].str.split(" ").str[:2].str.join(" ")
+            asset_list[self.address1_colname] = (
+                asset_list[full_address_col].str.split(" ").str[:2].str.join(" ")
+            )
             return asset_list
 
         if method == "first_word":
-            asset_list[self.address1_colname] = asset_list[full_address_col].str.split(" ").str[0]
+            asset_list[self.address1_colname] = (
+                asset_list[full_address_col].str.split(" ").str[0]
+            )
             return asset_list
 
         if method == "house_number_extraction":
             asset_list[self.address1_colname] = asset_list.apply(
-                lambda x: SearchEpc.get_house_number(address=x[full_address_col], postcode=x[postcode_col]),
-                axis=1
+                lambda x: SearchEpc.get_house_number(
+                    address=x[full_address_col], postcode=x[postcode_col]
+                ),
+                axis=1,
             )
 
             for _, x in asset_list.iterrows():
-                SearchEpc.get_house_number(address=x[full_address_col], postcode=x[postcode_col])
+                SearchEpc.get_house_number(
+                    address=x[full_address_col], postcode=x[postcode_col]
+                )
             return asset_list
 
         raise ValueError(f"Method {method} not recognized")
@@ -622,9 +738,16 @@ class AssetList:
 
         # Apply transformation
         self.standardised_asset_list[self.DOMNA_PROPERTY_ID] = (
-            self.standardised_asset_list[self.full_address_colname] +
-            self.standardised_asset_list[self.postcode_colname]
-        ).str.strip().str.replace(r"[^\w\s]", "", regex=True).str.replace(" ", "").str.lower().apply(_make_hash)
+            (
+                self.standardised_asset_list[self.full_address_colname]
+                + self.standardised_asset_list[self.postcode_colname]
+            )
+            .str.strip()
+            .str.replace(r"[^\w\s]", "", regex=True)
+            .str.replace(" ", "")
+            .str.lower()
+            .apply(_make_hash)
+        )
 
     @staticmethod
     def _strip_postcode_from_full_address(full_address, postcode):
@@ -666,9 +789,7 @@ class AssetList:
         postcode = postcode.replace("  ", " ")
         if " " not in postcode:
             # Restructure it
-            return " ".join(
-                [postcode[:-3], postcode[-3:]]
-            )
+            return " ".join([postcode[:-3], postcode[-3:]])
 
         return postcode
 
@@ -680,52 +801,72 @@ class AssetList:
 
         # Remove rows without a postcode
         if self.postcode_colname is not None:
-            self.standardised_asset_list = self.standardised_asset_list.dropna(subset=[self.postcode_colname])
+            self.standardised_asset_list = self.standardised_asset_list.dropna(
+                subset=[self.postcode_colname]
+            )
             # We also clean postcode columns where if there is not space, we create one
-            self.standardised_asset_list[self.postcode_colname] = self.standardised_asset_list[
-                self.postcode_colname
-            ].apply(self._clean_postcode)
+            self.standardised_asset_list[self.postcode_colname] = (
+                self.standardised_asset_list[self.postcode_colname].apply(
+                    self._clean_postcode
+                )
+            )
 
         # We clean up portential non-breaking spaces, and double spaces
         for col in [
-            c for c in [self.postcode_colname, self.full_address_colname, self.address1_colname] if
-            c is not None
+            c
+            for c in [
+                self.postcode_colname,
+                self.full_address_colname,
+                self.address1_colname,
+            ]
+            if c is not None
         ]:
-            self.standardised_asset_list[col] = self.standardised_asset_list[col].astype(str)
-            self.standardised_asset_list[col] = self.standardised_asset_list[col].str.replace('\xa0', ' ', regex=False)
-            self.standardised_asset_list[col] = self.standardised_asset_list[col].str.replace('  ', ' ', regex=False)
+            self.standardised_asset_list[col] = self.standardised_asset_list[
+                col
+            ].astype(str)
+            self.standardised_asset_list[col] = self.standardised_asset_list[
+                col
+            ].str.replace("\xa0", " ", regex=False)
+            self.standardised_asset_list[col] = self.standardised_asset_list[
+                col
+            ].str.replace("  ", " ", regex=False)
 
         if self.address1_colname is None:
             if self.address1_extraction_method is None:
-                raise ValueError("Missing address 1 - please specify an extraction method")
+                raise ValueError(
+                    "Missing address 1 - please specify an extraction method"
+                )
             self.address1_colname = self.STANDARD_ADDRESS_1
             # If we do not have this, we produce it
             self.standardised_asset_list = self._extract_address1(
                 asset_list=self.standardised_asset_list,
                 full_address_col=self.full_address_colname,
                 postcode_col=self.postcode_colname,
-                method=self.address1_extraction_method
+                method=self.address1_extraction_method,
             )
 
         if self.full_address_colname is None:
             if not self.full_address_cols_to_concat:
-                raise ValueError("Missing full address - please specify columns to concatenate")
+                raise ValueError(
+                    "Missing full address - please specify columns to concatenate"
+                )
             self.full_address_colname = self.STANDARD_FULL_ADDRESS
             self.standardised_asset_list[self.full_address_colname] = (
                 self.standardised_asset_list[self.full_address_cols_to_concat].apply(
-                    lambda x: ", ".join([y for y in x if not pd.isnull(y)]),
-                    axis=1
+                    lambda x: ", ".join([y for y in x if not pd.isnull(y)]), axis=1
                 )
             )
         else:
 
             # Make sure to strip the postcode out of the full address
-            self.standardised_asset_list[self.full_address_colname] = self.standardised_asset_list.apply(
-                lambda x: self._strip_postcode_from_full_address(
-                    full_address=x[self.full_address_colname],
-                    postcode=x[self.postcode_colname]
-                ),
-                axis=1
+            self.standardised_asset_list[self.full_address_colname] = (
+                self.standardised_asset_list.apply(
+                    lambda x: self._strip_postcode_from_full_address(
+                        full_address=x[self.full_address_colname],
+                        postcode=x[self.postcode_colname],
+                    ),
+                    axis=1,
+                )
             )
 
         # We create the domna property id
@@ -734,7 +875,9 @@ class AssetList:
         # Clean up the UPRN column, if the landlord has provided them
         if self.landlord_uprn is not None:
             self.standardised_asset_list[self.landlord_uprn] = (
-                self.standardised_asset_list[self.landlord_uprn].apply(self._convert_uprn)
+                self.standardised_asset_list[self.landlord_uprn].apply(
+                    self._convert_uprn
+                )
             )
 
         # We keep just the columns we care about and will work through the various columns and standardise
@@ -771,12 +914,15 @@ class AssetList:
             self.landlord_heating_system: self.STANDARD_HEATING_SYSTEM,
             self.landlord_existing_pv: self.STANDARD_EXISTING_PV,
             self.landlord_sap: self.STANDARD_SAP,
-            self.landlord_block_reference: self.STANDARD_BLOCK_REFERENCE
+            self.landlord_block_reference: self.STANDARD_BLOCK_REFERENCE,
         }
         self.rename_map = {k: v for k, v in self.rename_map.items() if k is not None}
 
         non_intrusive_columns = []
-        if self.non_intrusives_present and not self.new_format_non_insturives_present_v2:
+        if (
+            self.non_intrusives_present
+            and not self.new_format_non_insturives_present_v2
+        ):
             non_intrusive_columns = self.NON_INTRUSIVES_COLNAMES
 
         if self.non_intrusives_eligibility:
@@ -794,7 +940,9 @@ class AssetList:
         if self.old_format_non_intrusives_present:
             # We check if we have the ECO Eligibility column, which we might not have
             non_intrusive_columns = [
-                c for c in self.OLD_FORMAT_NON_INTRUSIVE_COLNAMES if c in self.standardised_asset_list.columns
+                c
+                for c in self.OLD_FORMAT_NON_INTRUSIVE_COLNAMES
+                if c in self.standardised_asset_list.columns
             ]
 
             if "Warmfront Finding" in self.standardised_asset_list.columns:
@@ -805,8 +953,11 @@ class AssetList:
         self.rename_map = {
             **self.rename_map,
             **dict(
-                zip(non_intrusive_columns, ["non-intrusives: " + c for c in non_intrusive_columns])
-            )
+                zip(
+                    non_intrusive_columns,
+                    ["non-intrusives: " + c for c in non_intrusive_columns],
+                )
+            ),
         }
 
         # We idenfiy addresses which are likely to be multi-addresses (i.g are rooms x-y)
@@ -818,11 +969,12 @@ class AssetList:
         # we see instances of "average thermal transmittance" in the description
         if self.landlord_wall_construction is not None:
             self.standardised_asset_list[self.landlord_wall_construction] = np.where(
-                self.standardised_asset_list[self.landlord_wall_construction].str.lower().str.contains(
-                    "average thermal transmittance"
-                ) == True,
-                "new build - average thermal transmittance",
                 self.standardised_asset_list[self.landlord_wall_construction]
+                .str.lower()
+                .str.contains("average thermal transmittance")
+                == True,
+                "new build - average thermal transmittance",
+                self.standardised_asset_list[self.landlord_wall_construction],
             )
         else:
             # We want to make sure that we have a column for wall construction
@@ -837,15 +989,21 @@ class AssetList:
         # We attempt to process the year built column
         if self.landlord_year_built is not None:
             # We check if we have a datetime - year built has not been renamed
-            if isinstance(self.standardised_asset_list[self.landlord_year_built].iloc[0], datetime):
+            if isinstance(
+                self.standardised_asset_list[self.landlord_year_built].iloc[0], datetime
+            ):
                 # We treat any string columns - with common values we see
                 self.standardised_asset_list[self.landlord_year_built] = (
-                    self.standardised_asset_list[self.landlord_year_built].replace(self.DATETIME_REMAP)
+                    self.standardised_asset_list[self.landlord_year_built].replace(
+                        self.DATETIME_REMAP
+                    )
                 )
 
                 no_data_codes = {"No Data": None}
                 self.standardised_asset_list[self.landlord_year_built] = (
-                    self.standardised_asset_list[self.landlord_year_built].replace(no_data_codes)
+                    self.standardised_asset_list[self.landlord_year_built].replace(
+                        no_data_codes
+                    )
                 )
 
                 self.standardised_asset_list[self.landlord_year_built] = pd.to_datetime(
@@ -866,7 +1024,7 @@ class AssetList:
                         "UNKNOWN",
                         "This cell has an external reference that can't be shown or edited. Editing this cell will "
                         "remove the external reference.",
-                        0
+                        0,
                     }
 
                     if pd.isnull(date_str) or date_str in known_errors:
@@ -889,7 +1047,9 @@ class AssetList:
                             return int(match.group(1))
 
                         # Find all 4-digit years in string
-                        years = [int(y) for y in re.findall(r"\b(?:19|20)\d{2}\b", date_str)]
+                        years = [
+                            int(y) for y in re.findall(r"\b(?:19|20)\d{2}\b", date_str)
+                        ]
                         if years:
                             return max(years)  # Return most recent year
 
@@ -898,38 +1058,42 @@ class AssetList:
                         if len(numeric_str) == 4 and numeric_str.isdigit():
                             return int(numeric_str)
 
-                    raise NotImplementedError(f"Unhandled format for year built, value is {date_str} - implement me")
+                    raise NotImplementedError(
+                        f"Unhandled format for year built, value is {date_str} - implement me"
+                    )
 
-                self.standardised_asset_list[self.landlord_year_built] = self.standardised_asset_list[
-                    self.landlord_year_built
-                ].apply(extract_year)
+                self.standardised_asset_list[self.landlord_year_built] = (
+                    self.standardised_asset_list[self.landlord_year_built].apply(
+                        extract_year
+                    )
+                )
 
         # We now create standard lookups
         to_remap = {
             self.landlord_property_type: {
                 "standard_values": property_type_mappings.STANDARD_PROPERTY_TYPES,
-                "standard_map": property_type_mappings.PROPERTY_MAPPING
+                "standard_map": property_type_mappings.PROPERTY_MAPPING,
             },
             self.landlord_built_form: {
                 "standard_values": built_form_mappings.STANDARD_BUILT_FORMS,
-                "standard_map": built_form_mappings.BUILT_FORM_MAPPINGS
+                "standard_map": built_form_mappings.BUILT_FORM_MAPPINGS,
             },
             self.landlord_wall_construction: {
                 "standard_values": walls_mappings.STANDARD_WALL_CONSTRUCTIONS,
-                "standard_map": walls_mappings.WALL_CONSTRUCTION_MAPPINGS
+                "standard_map": walls_mappings.WALL_CONSTRUCTION_MAPPINGS,
             },
             self.landlord_heating_system: {
                 "standard_values": heating_mappings.STANDARD_HEATING_SYSTEMS,
-                "standard_map": heating_mappings.HEATING_MAPPINGS
+                "standard_map": heating_mappings.HEATING_MAPPINGS,
             },
             self.landlord_existing_pv: {
                 "standard_values": existing_pv_mappings.STANDARD_EXISTING_PV,
-                "standard_map": existing_pv_mappings.EXISTING_PV_MAPPINGS
+                "standard_map": existing_pv_mappings.EXISTING_PV_MAPPINGS,
             },
             self.landlord_roof_construction: {
                 "standard_values": roof_mappings.STANDARD_ROOF_CONSTRUCTIONS,
-                "standard_map": roof_mappings.ROOF_CONSTRUCTION_MAPPINGS
-            }
+                "standard_map": roof_mappings.ROOF_CONSTRUCTION_MAPPINGS,
+            },
         }
         # Keep just entries where the key is not None
         to_remap = {k: v for k, v in to_remap.items() if k is not None}
@@ -937,11 +1101,18 @@ class AssetList:
         for variable, config in to_remap.items():
             logger.info("Standardising variable: %s", variable)
             # Strip each of these columns
-            self.standardised_asset_list[variable] = self.standardised_asset_list[variable].str.strip()
+            self.standardised_asset_list[variable] = self.standardised_asset_list[
+                variable
+            ].str.strip()
             values_to_remap = self.standardised_asset_list[variable].unique()
             # We want to map this to our standardised list of property types we're interested in
-            remapper = DataRemapper(standard_values=config["standard_values"], standard_map=config["standard_map"])
-            remap_dictionary = remapper.standardize_list(values_to_remap=values_to_remap.tolist())
+            remapper = DataRemapper(
+                standard_values=config["standard_values"],
+                standard_map=config["standard_map"],
+            )
+            remap_dictionary = remapper.standardize_list(
+                values_to_remap=values_to_remap.tolist()
+            )
             self.variable_mappings[variable] = remap_dictionary
 
         # We now print out the variable mappings, which can be reviewed by the user, before the final standardised
@@ -963,9 +1134,12 @@ class AssetList:
 
         if self.phase:
             # We filter on just the properties that have had an inspection
-            if self.new_format_non_insturives_present_v2 or self.solar_non_intrusives_present:
+            if (
+                self.new_format_non_insturives_present_v2
+                or self.solar_non_intrusives_present
+            ):
                 self.standardised_asset_list = self.standardised_asset_list[
-                    ~self.standardised_asset_list['NAME OF SURVEYOR'].isin(
+                    ~self.standardised_asset_list["NAME OF SURVEYOR"].isin(
                         ["YET TO BE SURVEYED", "", None]
                     )
                 ]
@@ -974,7 +1148,9 @@ class AssetList:
                 ]
             else:
                 self.standardised_asset_list = self.standardised_asset_list[
-                    ~self.standardised_asset_list['Surveyors Name'].isin(["YET TO BE SURVEYED"])
+                    ~self.standardised_asset_list["Surveyors Name"].isin(
+                        ["YET TO BE SURVEYED"]
+                    )
                 ]
 
         if not self.variable_mappings and not override_empty_mappings:
@@ -986,7 +1162,9 @@ class AssetList:
             self.standardised_asset_list[variable + "_original_from_landlord"] = (
                 self.standardised_asset_list[variable].copy()
             )
-            self.standardised_asset_list[variable] = self.standardised_asset_list[variable].map(mapping)
+            self.standardised_asset_list[variable] = self.standardised_asset_list[
+                variable
+            ].map(mapping)
 
         if self.standardised_asset_list[self.DOMNA_PROPERTY_ID].duplicated().sum():
             # Drop the dupes
@@ -998,13 +1176,28 @@ class AssetList:
             # Keep a record of duplicates
             self.duplicated_addresses = self.standardised_asset_list[
                 self.standardised_asset_list[self.DOMNA_PROPERTY_ID].duplicated()
-            ][[self.DOMNA_PROPERTY_ID, self.full_address_colname, self.address1_colname, self.postcode_colname]].copy()
+            ][
+                [
+                    self.DOMNA_PROPERTY_ID,
+                    self.full_address_colname,
+                    self.address1_colname,
+                    self.postcode_colname,
+                ]
+            ].copy()
 
             df = self.standardised_asset_list[
                 self.standardised_asset_list[self.DOMNA_PROPERTY_ID].isin(
-                    self.duplicated_addresses[self.DOMNA_PROPERTY_ID])
-            ][[self.landlord_property_id, self.DOMNA_PROPERTY_ID, self.full_address_colname, self.address1_colname,
-               self.postcode_colname]].copy()
+                    self.duplicated_addresses[self.DOMNA_PROPERTY_ID]
+                )
+            ][
+                [
+                    self.landlord_property_id,
+                    self.DOMNA_PROPERTY_ID,
+                    self.full_address_colname,
+                    self.address1_colname,
+                    self.postcode_colname,
+                ]
+            ].copy()
 
             df = df.sort_values(by=[self.DOMNA_PROPERTY_ID])
 
@@ -1020,13 +1213,14 @@ class AssetList:
             k + "_original_from_landlord" for k in self.variable_mappings.keys()
         ]
 
-        self.standardised_asset_list = self.standardised_asset_list[self.keep_variables].rename(
-            columns=self.rename_map
-        )
+        self.standardised_asset_list = self.standardised_asset_list[
+            self.keep_variables
+        ].rename(columns=self.rename_map)
 
         # We fill any standard columns that are not in the data because they were not provided by the landlord
         missing_variables = [
-            v for v in [
+            v
+            for v in [
                 self.STANDARD_EXISTING_PV,
                 self.STANDARD_HEATING_SYSTEM,
                 self.STANDARD_UPRN,
@@ -1035,7 +1229,8 @@ class AssetList:
                 self.STANDARD_WALL_CONSTRUCTION,
                 self.STANDARD_HEATING_SYSTEM,
                 self.STANDARD_BLOCK_REFERENCE,
-            ] if v not in self.standardised_asset_list.columns
+            ]
+            if v not in self.standardised_asset_list.columns
         ]
         for v in missing_variables:
             self.standardised_asset_list[v] = None
@@ -1050,13 +1245,13 @@ class AssetList:
             self.standardised_asset_list[self.STANDARD_SAP] = (
                 self.standardised_asset_list[self.STANDARD_SAP]
                 .astype(str)
-                .str.replace('\xa0', ' ', regex=False)
+                .str.replace("\xa0", " ", regex=False)
                 .str.strip()
             )
             self.standardised_asset_list[self.STANDARD_SAP] = np.where(
                 self.standardised_asset_list[self.STANDARD_SAP] == "",
                 None,
-                self.standardised_asset_list[self.STANDARD_SAP]
+                self.standardised_asset_list[self.STANDARD_SAP],
             )
             self.standardised_asset_list[self.STANDARD_SAP] = (
                 self.standardised_asset_list[self.STANDARD_SAP].astype(float)
@@ -1065,10 +1260,13 @@ class AssetList:
             self.standardised_asset_list[self.STANDARD_SAP] = np.where(
                 self.standardised_asset_list[self.STANDARD_SAP] == 0,
                 None,
-                self.standardised_asset_list[self.STANDARD_SAP]
+                self.standardised_asset_list[self.STANDARD_SAP],
             )
 
-        has_blocks_of_flats = (self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE] == "block of flats").sum()
+        has_blocks_of_flats = (
+            self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE]
+            == "block of flats"
+        ).sum()
 
         # Perform block splitting, ahead of fetching the EPC data
         # If we blocks of flats, without a landlord block reference, we create this
@@ -1083,13 +1281,12 @@ class AssetList:
         :return:
         """
         if self.DOMNA_PROPERTY_ID not in df.columns:
-            raise ValueError(f"Dataframe must contain the column {self.DOMNA_PROPERTY_ID}")
+            raise ValueError(
+                f"Dataframe must contain the column {self.DOMNA_PROPERTY_ID}"
+            )
 
         if df[self.DOMNA_PROPERTY_ID].duplicated().sum():
-            df = df.drop_duplicates(
-                subset=[self.DOMNA_PROPERTY_ID],
-                keep="first"
-            )
+            df = df.drop_duplicates(subset=[self.DOMNA_PROPERTY_ID], keep="first")
 
         self.standardised_asset_list = self.standardised_asset_list.merge(
             df, how="left", on=self.DOMNA_PROPERTY_ID
@@ -1098,9 +1295,14 @@ class AssetList:
     def extract_attributes(self, pull_epc=True):
         # Used to extracty the typical attributes that we use to identify viable work
 
-        self.standardised_asset_list[self.ATTRIBUTE_HAS_SOLAR] = (
-            self.standardised_asset_list[self.FIND_EPC_DATA_NAMES["Solar photovoltaics"]] |
-            ~self.standardised_asset_list[self.EPC_API_DATA_NAMES["photo-supply"]].isin(["0.0", 0, None, "", np.nan])
+        self.standardised_asset_list[
+            self.ATTRIBUTE_HAS_SOLAR
+        ] = self.standardised_asset_list[
+            self.FIND_EPC_DATA_NAMES["Solar photovoltaics"]
+        ] | ~self.standardised_asset_list[
+            self.EPC_API_DATA_NAMES["photo-supply"]
+        ].isin(
+            ["0.0", 0, None, "", np.nan]
         )
 
         accepted_epc_property_types = ["House", "Flat", "Bungalow", "Maisonette"]
@@ -1109,83 +1311,127 @@ class AssetList:
         # 1) Take the property type provided by the HA themselves
         # 2) In absence of that, take the EPC property type
         # 3) Otherwise use None
-        self.standardised_asset_list[self.ATTRIBUTE_NUMBER_OF_FLOORS] = self.standardised_asset_list.apply(
-            lambda x: estimate_number_of_floors(
-                property_type=(
-                    str(x[self.STANDARD_PROPERTY_TYPE]).title() if
-                    str(x[self.STANDARD_PROPERTY_TYPE]).title() in accepted_epc_property_types else (
-                        x[self.EPC_API_DATA_NAMES["property-type"]] if not
-                        pd.isnull(x[self.EPC_API_DATA_NAMES["property-type"]]) else None
+        self.standardised_asset_list[self.ATTRIBUTE_NUMBER_OF_FLOORS] = (
+            self.standardised_asset_list.apply(
+                lambda x: estimate_number_of_floors(
+                    property_type=(
+                        str(x[self.STANDARD_PROPERTY_TYPE]).title()
+                        if str(x[self.STANDARD_PROPERTY_TYPE]).title()
+                        in accepted_epc_property_types
+                        else (
+                            x[self.EPC_API_DATA_NAMES["property-type"]]
+                            if not pd.isnull(
+                                x[self.EPC_API_DATA_NAMES["property-type"]]
+                            )
+                            else None
+                        )
                     )
-                )
-            ),
-            axis=1
+                ),
+                axis=1,
+            )
         )
 
         self.standardised_asset_list[self.EPC_API_DATA_NAMES["total-floor-area"]] = (
-            self.standardised_asset_list[self.EPC_API_DATA_NAMES["total-floor-area"]].astype(float)
+            self.standardised_asset_list[
+                self.EPC_API_DATA_NAMES["total-floor-area"]
+            ].astype(float)
         )
         # Replace "" value with None
-        self.standardised_asset_list[self.EPC_API_DATA_NAMES["number-habitable-rooms"]] = (
-            self.standardised_asset_list[self.EPC_API_DATA_NAMES["number-habitable-rooms"]].replace("", None)
+        self.standardised_asset_list[
+            self.EPC_API_DATA_NAMES["number-habitable-rooms"]
+        ] = self.standardised_asset_list[
+            self.EPC_API_DATA_NAMES["number-habitable-rooms"]
+        ].replace(
+            "", None
         )
-        self.standardised_asset_list[self.EPC_API_DATA_NAMES["number-habitable-rooms"]] = (
-            self.standardised_asset_list[self.EPC_API_DATA_NAMES["number-habitable-rooms"]].astype(float)
+        self.standardised_asset_list[
+            self.EPC_API_DATA_NAMES["number-habitable-rooms"]
+        ] = self.standardised_asset_list[
+            self.EPC_API_DATA_NAMES["number-habitable-rooms"]
+        ].astype(
+            float
         )
 
         # Estimate the perimeter
         # Handle funky edge case
-        self.standardised_asset_list[self.EPC_API_DATA_NAMES["total-floor-area"]] = np.where(
-            (self.standardised_asset_list[self.EPC_API_DATA_NAMES["total-floor-area"]] == 0),
-            self.standardised_asset_list[self.EPC_API_DATA_NAMES["total-floor-area"]].mean(),
-            self.standardised_asset_list[self.EPC_API_DATA_NAMES["total-floor-area"]]
-        )
-
-        self.standardised_asset_list[self.ATTRIBUTE_ESTIMATED_PERIMETER] = self.standardised_asset_list.apply(
-            lambda x: estimate_perimeter(
-                floor_area=x[self.EPC_API_DATA_NAMES["total-floor-area"]] / x[self.ATTRIBUTE_NUMBER_OF_FLOORS],
-                num_rooms=x[self.EPC_API_DATA_NAMES["number-habitable-rooms"]] / x[self.ATTRIBUTE_NUMBER_OF_FLOORS],
-            ), axis=1
-        )
-
-        self.standardised_asset_list[self.ATTRIBUTE_HEAT_LOSS_AREA] = self.standardised_asset_list.apply(
-            lambda x: estimate_external_wall_area(
-                num_floors=x[self.ATTRIBUTE_NUMBER_OF_FLOORS],
-                floor_height=(
-                    float(x[self.EPC_API_DATA_NAMES["floor-height"]]) if
-                    not pd.isnull(x[self.EPC_API_DATA_NAMES["floor-height"]]) else 2.5
+        self.standardised_asset_list[self.EPC_API_DATA_NAMES["total-floor-area"]] = (
+            np.where(
+                (
+                    self.standardised_asset_list[
+                        self.EPC_API_DATA_NAMES["total-floor-area"]
+                    ]
+                    == 0
                 ),
-                perimeter=x[self.ATTRIBUTE_ESTIMATED_PERIMETER],
-                built_form=x[self.EPC_API_DATA_NAMES["built-form"]]
-            ),
-            axis=1
+                self.standardised_asset_list[
+                    self.EPC_API_DATA_NAMES["total-floor-area"]
+                ].mean(),
+                self.standardised_asset_list[
+                    self.EPC_API_DATA_NAMES["total-floor-area"]
+                ],
+            )
         )
-        
+
+        self.standardised_asset_list[self.ATTRIBUTE_ESTIMATED_PERIMETER] = (
+            self.standardised_asset_list.apply(
+                lambda x: estimate_perimeter(
+                    floor_area=x[self.EPC_API_DATA_NAMES["total-floor-area"]]
+                    / x[self.ATTRIBUTE_NUMBER_OF_FLOORS],
+                    num_rooms=x[self.EPC_API_DATA_NAMES["number-habitable-rooms"]]
+                    / x[self.ATTRIBUTE_NUMBER_OF_FLOORS],
+                ),
+                axis=1,
+            )
+        )
+
+        self.standardised_asset_list[self.ATTRIBUTE_HEAT_LOSS_AREA] = (
+            self.standardised_asset_list.apply(
+                lambda x: estimate_external_wall_area(
+                    num_floors=x[self.ATTRIBUTE_NUMBER_OF_FLOORS],
+                    floor_height=(
+                        float(x[self.EPC_API_DATA_NAMES["floor-height"]])
+                        if not pd.isnull(x[self.EPC_API_DATA_NAMES["floor-height"]])
+                        else 2.5
+                    ),
+                    perimeter=x[self.ATTRIBUTE_ESTIMATED_PERIMETER],
+                    built_form=x[self.EPC_API_DATA_NAMES["built-form"]],
+                ),
+                axis=1,
+            )
+        )
+
         col = self.EPC_API_DATA_NAMES["roof-description"]
 
-        self.standardised_asset_list[self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS] = self.standardised_asset_list.apply(
-            lambda x: RoofAttributes(description=x[col]).process()[
-                "insulation_thickness"] if not pd.isnull(
-                x[col]) else None,
-            axis=1
+        self.standardised_asset_list[self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS] = (
+            self.standardised_asset_list.apply(
+                lambda x: (
+                    RoofAttributes(description=x[col]).process()["insulation_thickness"]
+                    if not pd.isnull(x[col])
+                    else None
+                ),
+                axis=1,
+            )
         )
 
-
         self.standardised_asset_list[self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS] = (
-            self.standardised_asset_list[self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS].str.replace("+", "")
+            self.standardised_asset_list[
+                self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS
+            ].str.replace("+", "")
         )
 
         # We produce some additional fields
         # 1) Is the SAP rating below C75
         self.standardised_asset_list[self.ATTRIBUTE_SAP_THRESHOLD_AND_BELOW] = (
-            self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]].astype(float) <=
-            self.FILLED_CAVITY_SAP_THRESHOLD
+            self.standardised_asset_list[
+                self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+            ].astype(float)
+            <= self.FILLED_CAVITY_SAP_THRESHOLD
         )
         # 2) Flag anything where the EPC is older than 5 years
         self.standardised_asset_list[self.ATTRIBUTE_EPC_PRE_YEAR_THRESHOLD] = (
             pd.to_datetime(
                 self.standardised_asset_list[self.EPC_API_DATA_NAMES["inspection-date"]]
-            ).dt.year < self.EPC_YEAR_THRESHOLD
+            ).dt.year
+            < self.EPC_YEAR_THRESHOLD
         )
 
         self.process_age_band()
@@ -1195,30 +1441,37 @@ class AssetList:
         for _, x in self.standardised_asset_list.iterrows():
 
             if pd.isnull(x[self.EPC_API_DATA_NAMES["construction-age-band"]]) or (
-                x[self.EPC_API_DATA_NAMES["construction-age-band"]] in Definitions.DATA_ANOMALY_MATCHES
+                x[self.EPC_API_DATA_NAMES["construction-age-band"]]
+                in Definitions.DATA_ANOMALY_MATCHES
             ):
                 processed_age_band.append(
                     {
                         self.DOMNA_PROPERTY_ID: x[self.DOMNA_PROPERTY_ID],
                         "epc_year_lower_bound": None,
                         "epc_year_upper_bound": None,
-                        "does_age_band_match_epc_age_band": "No EPC Age Band"
+                        "does_age_band_match_epc_age_band": "No EPC Age Band",
                     }
                 )
                 continue
 
             # We exatract the upper and lower bounds
             if x[self.EPC_API_DATA_NAMES["construction-age-band"]] in [
-                "England and Wales: 2007 onwards", "England and Wales: 2012 onwards"
+                "England and Wales: 2007 onwards",
+                "England and Wales: 2012 onwards",
             ]:
-                year_lower_bound = 2007 if x[self.EPC_API_DATA_NAMES[
-                    "construction-age-band"]] == "England and Wales: 2007 onwards" else 2012
+                year_lower_bound = (
+                    2007
+                    if x[self.EPC_API_DATA_NAMES["construction-age-band"]]
+                    == "England and Wales: 2007 onwards"
+                    else 2012
+                )
 
                 if pd.isnull(x[self.STANDARD_YEAR_BUILT]):
                     age_band_matches = "No Year Built From Landlord"
                 else:
                     age_band_matches = (
-                        "EPC Age Band Matches Year Built" if x[self.STANDARD_YEAR_BUILT] >= year_lower_bound
+                        "EPC Age Band Matches Year Built"
+                        if x[self.STANDARD_YEAR_BUILT] >= year_lower_bound
                         else "EPC Age Band is older than Year Built"
                     )
 
@@ -1227,18 +1480,22 @@ class AssetList:
                         self.DOMNA_PROPERTY_ID: x[self.DOMNA_PROPERTY_ID],
                         "epc_year_lower_bound": year_lower_bound,
                         "epc_year_upper_bound": None,
-                        "does_age_band_match_epc_age_band": age_band_matches
+                        "does_age_band_match_epc_age_band": age_band_matches,
                     }
                 )
                 continue
 
-            if x[self.EPC_API_DATA_NAMES["construction-age-band"]] == "England and Wales: before 1900":
+            if (
+                x[self.EPC_API_DATA_NAMES["construction-age-band"]]
+                == "England and Wales: before 1900"
+            ):
 
                 if pd.isnull(x[self.STANDARD_YEAR_BUILT]):
                     age_band_matches = "No Year Built From Landlord"
                 else:
                     age_band_matches = (
-                        "EPC Age Band Matches Year Built" if x[self.STANDARD_YEAR_BUILT] < 1900
+                        "EPC Age Band Matches Year Built"
+                        if x[self.STANDARD_YEAR_BUILT] < 1900
                         else "EPC Age Band is newer than Year Built"
                     )
 
@@ -1247,7 +1504,7 @@ class AssetList:
                         self.DOMNA_PROPERTY_ID: x[self.DOMNA_PROPERTY_ID],
                         "epc_year_lower_bound": None,
                         "epc_year_upper_bound": 1899,
-                        "does_age_band_match_epc_age_band": age_band_matches
+                        "does_age_band_match_epc_age_band": age_band_matches,
                     }
                 )
                 continue
@@ -1258,35 +1515,44 @@ class AssetList:
                     age_band_matches = "No Year Built From Landlord"
                 else:
                     age_band_matches = (
-                        "EPC Age Band Matches Year Built" if x[self.STANDARD_YEAR_BUILT] == int(
-                            x[self.EPC_API_DATA_NAMES["construction-age-band"]]
-                        )
+                        "EPC Age Band Matches Year Built"
+                        if x[self.STANDARD_YEAR_BUILT]
+                        == int(x[self.EPC_API_DATA_NAMES["construction-age-band"]])
                         else "EPC Age Band is different from Year Built"
                     )
 
                 processed_age_band.append(
                     {
                         self.DOMNA_PROPERTY_ID: x[self.DOMNA_PROPERTY_ID],
-                        "epc_year_lower_bound": int(x[self.EPC_API_DATA_NAMES["construction-age-band"]]),
-                        "epc_year_upper_bound": int(x[self.EPC_API_DATA_NAMES["construction-age-band"]]),
-                        "does_age_band_match_epc_age_band": age_band_matches
+                        "epc_year_lower_bound": int(
+                            x[self.EPC_API_DATA_NAMES["construction-age-band"]]
+                        ),
+                        "epc_year_upper_bound": int(
+                            x[self.EPC_API_DATA_NAMES["construction-age-band"]]
+                        ),
+                        "does_age_band_match_epc_age_band": age_band_matches,
                     }
                 )
                 continue
 
             # Oherwise, we extract the upper and lower bounds
-            age_band = x[self.EPC_API_DATA_NAMES["construction-age-band"]].split(": ")[1]
+            age_band = x[self.EPC_API_DATA_NAMES["construction-age-band"]].split(": ")[
+                1
+            ]
             lower_date, upper_date = age_band.split("-")
 
             if not x[self.STANDARD_YEAR_BUILT]:
                 age_band_matches = "No Year Built From Landlord"
             else:
                 age_band_matches = (
-                    "EPC Age Band Matches Year Built" if (x[self.STANDARD_YEAR_BUILT] >= float(lower_date)) and (
-                        x[self.STANDARD_YEAR_BUILT] <= float(upper_date)
+                    "EPC Age Band Matches Year Built"
+                    if (x[self.STANDARD_YEAR_BUILT] >= float(lower_date))
+                    and (x[self.STANDARD_YEAR_BUILT] <= float(upper_date))
+                    else (
+                        "EPC Age Band is older than Year Built"
+                        if x[self.STANDARD_YEAR_BUILT] > float(upper_date)
+                        else "EPC Age Band is newer than Year Built"
                     )
-                    else "EPC Age Band is older than Year Built" if x[self.STANDARD_YEAR_BUILT] > float(upper_date)
-                    else "EPC Age Band is newer than Year Built"
                 )
 
             processed_age_band.append(
@@ -1294,7 +1560,7 @@ class AssetList:
                     self.DOMNA_PROPERTY_ID: x[self.DOMNA_PROPERTY_ID],
                     "epc_year_lower_bound": int(lower_date),
                     "epc_year_upper_bound": int(upper_date),
-                    "does_age_band_match_epc_age_band": age_band_matches
+                    "does_age_band_match_epc_age_band": age_band_matches,
                 }
             )
 
@@ -1310,34 +1576,54 @@ class AssetList:
             # We add a SAP category for all work type identification
             self.standardised_asset_list["SAP Category"] = np.where(
                 (
-                    (self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]] <= 54) |
-                    (self.standardised_asset_list[self.STANDARD_SAP] <= 54)
+                    (
+                        self.standardised_asset_list[
+                            self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+                        ]
+                        <= 54
+                    )
+                    | (self.standardised_asset_list[self.STANDARD_SAP] <= 54)
                 ),
                 "SAP Rating 54 or less",
                 np.where(
                     (
-                        (self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]] <= 68) |
-                        (self.standardised_asset_list[self.STANDARD_SAP] <= 68)
+                        (
+                            self.standardised_asset_list[
+                                self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+                            ]
+                            <= 68
+                        )
+                        | (self.standardised_asset_list[self.STANDARD_SAP] <= 68)
                     ),
                     "SAP Rating 55-68",
                     np.where(
                         (
                             (
-                                self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]] <=
-                                self.EMPTY_CAVITY_SAP_THRESHOLD
-                            ) | (self.standardised_asset_list[self.STANDARD_SAP] <= self.EMPTY_CAVITY_SAP_THRESHOLD)
+                                self.standardised_asset_list[
+                                    self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+                                ]
+                                <= self.EMPTY_CAVITY_SAP_THRESHOLD
+                            )
+                            | (
+                                self.standardised_asset_list[self.STANDARD_SAP]
+                                <= self.EMPTY_CAVITY_SAP_THRESHOLD
+                            )
                         ),
                         f"SAP Rating 69-{self.EMPTY_CAVITY_SAP_THRESHOLD}",
-                        f"SAP Rating {self.EMPTY_CAVITY_SAP_THRESHOLD + 1} or more"
+                        f"SAP Rating {self.EMPTY_CAVITY_SAP_THRESHOLD + 1} or more",
                     ),
-                )
+                ),
             )
 
             self.standardised_asset_list["SAP Category"] = np.where(
-                pd.isnull(self.standardised_asset_list[self.STANDARD_SAP]) &
-                pd.isnull(self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]]),
+                pd.isnull(self.standardised_asset_list[self.STANDARD_SAP])
+                & pd.isnull(
+                    self.standardised_asset_list[
+                        self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+                    ]
+                ),
                 "SAP Unknown",
-                self.standardised_asset_list["SAP Category"]
+                self.standardised_asset_list["SAP Category"],
             )
 
         else:
@@ -1345,55 +1631,81 @@ class AssetList:
             # We break into 4 categories (54 or less, 55-68, 69-74, 75 or more)
 
             self.standardised_asset_list["SAP Category"] = np.where(
-                (self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]] <= 54),
+                (
+                    self.standardised_asset_list[
+                        self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+                    ]
+                    <= 54
+                ),
                 "SAP Rating 54 or less",
                 np.where(
-                    (self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]] <= 68),
+                    (
+                        self.standardised_asset_list[
+                            self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+                        ]
+                        <= 68
+                    ),
                     "SAP Rating 55-68",
                     np.where(
                         (
-                            self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]] <=
-                            self.EMPTY_CAVITY_SAP_THRESHOLD
+                            self.standardised_asset_list[
+                                self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+                            ]
+                            <= self.EMPTY_CAVITY_SAP_THRESHOLD
                         ),
                         f"SAP Rating 69-{self.EMPTY_CAVITY_SAP_THRESHOLD}",
-                        f"SAP Rating {self.EMPTY_CAVITY_SAP_THRESHOLD + 1} or more"
+                        f"SAP Rating {self.EMPTY_CAVITY_SAP_THRESHOLD + 1} or more",
                     ),
-                )
+                ),
             )
             self.standardised_asset_list["SAP Category"] = np.where(
-                pd.isnull(self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]]),
+                pd.isnull(
+                    self.standardised_asset_list[
+                        self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+                    ]
+                ),
                 "SAP Unknown",
-                self.standardised_asset_list["SAP Category"]
+                self.standardised_asset_list["SAP Category"],
             )
 
         # Before we being, we identify if a property has solar already as we use this
         # for identifying cavity jobs
         if self.non_intrusives_present and not self.old_format_non_intrusives_present:
 
-            if self.new_format_non_insturives_present_v2 or self.solar_non_intrusives_present:
+            if (
+                self.new_format_non_insturives_present_v2
+                or self.solar_non_intrusives_present
+            ):
                 existing_solar_non_intrusives_check = (
-                    self.standardised_asset_list["non-intrusives: ROOF ORIENTATION"].str.strip().isin(
-                        ["ALREADY HAS SOLAR PV", "ALREADY HAS PV"]
-                    )
+                    self.standardised_asset_list["non-intrusives: ROOF ORIENTATION"]
+                    .str.strip()
+                    .isin(["ALREADY HAS SOLAR PV", "ALREADY HAS PV"])
                 )
             else:
                 existing_solar_non_intrusives_check = (
-                    self.standardised_asset_list["non-intrusives: PV, ACCESS ISSUE, SEE NOTES"] == "SOLAR PV ON ROOF"
+                    self.standardised_asset_list[
+                        "non-intrusives: PV, ACCESS ISSUE, SEE NOTES"
+                    ]
+                    == "SOLAR PV ON ROOF"
                 )
         elif self.old_format_non_intrusives_present:
             existing_solar_non_intrusives_check = (
-                self.standardised_asset_list["non-intrusives: WFT Findings"].str.lower().str.strip().isin(
-                    ["solar pv on roof"]
-                )
+                self.standardised_asset_list["non-intrusives: WFT Findings"]
+                .str.lower()
+                .str.strip()
+                .isin(["solar pv on roof"])
             )
         else:
             # We don't have an indication
             existing_solar_non_intrusives_check = False
 
         self.standardised_asset_list["property_has_solar"] = (
-            (self.standardised_asset_list[self.STANDARD_EXISTING_PV] == "already has PV") |
-            existing_solar_non_intrusives_check |
-            (self.standardised_asset_list[self.ATTRIBUTE_HAS_SOLAR])
+            (
+                self.standardised_asset_list[self.STANDARD_EXISTING_PV]
+                == "already has PV"
+            )
+            | existing_solar_non_intrusives_check
+            | (self.standardised_asset_list[self.ATTRIBUTE_HAS_SOLAR])
         )
 
         # If we have non-intrusives completed, we can use this to identify work types
@@ -1407,25 +1719,41 @@ class AssetList:
         if self.non_intrusives_present:
             if self.new_format_non_insturives_present_v2:
                 non_intrusives_wall_filter = (
-                    (self.standardised_asset_list['non-intrusives: Construction'] == "CAVITY") &
-                    self.standardised_asset_list['non-intrusives: Insulated'].isin(["EMPTY", "PARTIAL", "EMPTY CAVITY"])
+                    self.standardised_asset_list["non-intrusives: Construction"]
+                    == "CAVITY"
+                ) & self.standardised_asset_list["non-intrusives: Insulated"].isin(
+                    ["EMPTY", "PARTIAL", "EMPTY CAVITY"]
                 )
             else:
                 non_intrusives_wall_filter = (
-                    (self.standardised_asset_list['non-intrusives: Construction'] == "CAVITY") &
-                    self.standardised_asset_list['non-intrusives: Insulated'].isin(["EMPTY", "PARTIAL"])
+                    self.standardised_asset_list["non-intrusives: Construction"]
+                    == "CAVITY"
+                ) & self.standardised_asset_list["non-intrusives: Insulated"].isin(
+                    ["EMPTY", "PARTIAL"]
                 )
         elif self.old_format_non_intrusives_present:
-            non_intrusives_wall_filter = (
-                self.standardised_asset_list['non-intrusives: WFT Findings'].str.lower().str.strip().isin(
-                    ["empty cavity", "partial fill", "empty", "EMPTY CAVITY 70MM", "partial", "empty cav"]
-                ) | (
-                    (
-                        self.standardised_asset_list['non-intrusives: WFT Findings']
-                        .str.lower().str.strip().str.contains("empty cavity|partial fill") &
-                        ~self.standardised_asset_list['non-intrusives: WFT Findings']
-                        .astype(str).str.lower().str.strip().str.contains("major access issues")
-                    )
+            non_intrusives_wall_filter = self.standardised_asset_list[
+                "non-intrusives: WFT Findings"
+            ].str.lower().str.strip().isin(
+                [
+                    "empty cavity",
+                    "partial fill",
+                    "empty",
+                    "EMPTY CAVITY 70MM",
+                    "partial",
+                    "empty cav",
+                ]
+            ) | (
+                (
+                    self.standardised_asset_list["non-intrusives: WFT Findings"]
+                    .str.lower()
+                    .str.strip()
+                    .str.contains("empty cavity|partial fill")
+                    & ~self.standardised_asset_list["non-intrusives: WFT Findings"]
+                    .astype(str)
+                    .str.lower()
+                    .str.strip()
+                    .str.contains("major access issues")
                 )
             )
         else:
@@ -1433,11 +1761,17 @@ class AssetList:
             non_intrusives_wall_filter = False
 
         if self.landlord_year_built is None:
-            year_built_filter = self.standardised_asset_list["epc_year_upper_bound"] <= self.EMPTY_CAVITY_YEAR_THRESHOLD
+            year_built_filter = (
+                self.standardised_asset_list["epc_year_upper_bound"]
+                <= self.EMPTY_CAVITY_YEAR_THRESHOLD
+            )
         else:
             year_built_filter = (
-                (self.standardised_asset_list[self.STANDARD_YEAR_BUILT] <= self.EMPTY_CAVITY_YEAR_THRESHOLD) |
-                (self.standardised_asset_list["epc_year_upper_bound"] <= self.EMPTY_CAVITY_YEAR_THRESHOLD)
+                self.standardised_asset_list[self.STANDARD_YEAR_BUILT]
+                <= self.EMPTY_CAVITY_YEAR_THRESHOLD
+            ) | (
+                self.standardised_asset_list["epc_year_upper_bound"]
+                <= self.EMPTY_CAVITY_YEAR_THRESHOLD
             )
 
         # Criteria:
@@ -1446,74 +1780,118 @@ class AssetList:
         # The EPC year is before 2002
         # We also flag where the property has solar on the roof, because this is a signal of a high EPC rating
         self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] = (
-            (~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(["bedsit"])) &
-            non_intrusives_wall_filter &
-            year_built_filter &
             (
-                ~self.standardised_asset_list["property_has_solar"]
+                ~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(
+                    ["bedsit"]
+                )
             )
+            & non_intrusives_wall_filter
+            & year_built_filter
+            & (~self.standardised_asset_list["property_has_solar"])
         )
 
-        self.standardised_asset_list["non_intrusive_indicates_empty_cavity_has_solar"] = (
-            ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] &
-            (~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(["bedsit"])) &
-            non_intrusives_wall_filter &
-            year_built_filter &
-            (
+        self.standardised_asset_list[
+            "non_intrusive_indicates_empty_cavity_has_solar"
+        ] = (
+            ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"]
+            & (
+                ~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(
+                    ["bedsit"]
+                )
+            )
+            & non_intrusives_wall_filter
+            & year_built_filter
+            & (
                 # If the property has solar, there's a chance it won't qualify
                 self.standardised_asset_list["property_has_solar"]
             )
         )
 
         # We also add a filter on anything that was generally identified by the non-intrusives
-        self.standardised_asset_list["non_intrusive_indicates_empty_cavity_no_year_filter"] = (
-            ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] &
-            ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity_has_solar"] &
-            (~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(["bedsit"])) &
-            non_intrusives_wall_filter
+        self.standardised_asset_list[
+            "non_intrusive_indicates_empty_cavity_no_year_filter"
+        ] = (
+            ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"]
+            & ~self.standardised_asset_list[
+                "non_intrusive_indicates_empty_cavity_has_solar"
+            ]
+            & (
+                ~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(
+                    ["bedsit"]
+                )
+            )
+            & non_intrusives_wall_filter
         )
 
-        if (not self.non_intrusives_eligibility) and (not self.old_format_non_intrusives_present):
+        if (not self.non_intrusives_eligibility) and (
+            not self.old_format_non_intrusives_present
+        ):
             # If we have NO inspections data, we capture all of the wall types and don't filter on age of the EPC
             self.standardised_asset_list["epc_indicates_empty_cavity"] = (
-                self.standardised_asset_list[self.EPC_API_DATA_NAMES["walls-description"]].str.lower().isin(
-                    self.EPC_NO_WALL_INSULATION_DESCRIPTIONS
-                ) & (
-                    self.standardised_asset_list["epc_year_upper_bound"] <= self.EMPTY_CAVITY_YEAR_THRESHOLD
-                ) & (
-                    ~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(["bedsit"])
+                self.standardised_asset_list[
+                    self.EPC_API_DATA_NAMES["walls-description"]
+                ]
+                .str.lower()
+                .isin(self.EPC_NO_WALL_INSULATION_DESCRIPTIONS)
+                & (
+                    self.standardised_asset_list["epc_year_upper_bound"]
+                    <= self.EMPTY_CAVITY_YEAR_THRESHOLD
+                )
+                & (
+                    ~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(
+                        ["bedsit"]
+                    )
                 )
             )
         else:
             self.standardised_asset_list["epc_indicates_empty_cavity"] = (
-                self.standardised_asset_list[self.EPC_API_DATA_NAMES["walls-description"]].str.lower().isin(
-                    self.EPC_NO_WALL_INSULATION_DESCRIPTIONS
-                ) & (
-                    self.standardised_asset_list["epc_year_upper_bound"] <= self.EMPTY_CAVITY_YEAR_THRESHOLD
-                ) & (
-                    ~self.standardised_asset_list[self.ATTRIBUTE_EPC_PRE_YEAR_THRESHOLD]
-                ) & (
-                    ~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(["bedsit"])
+                self.standardised_asset_list[
+                    self.EPC_API_DATA_NAMES["walls-description"]
+                ]
+                .str.lower()
+                .isin(self.EPC_NO_WALL_INSULATION_DESCRIPTIONS)
+                & (
+                    self.standardised_asset_list["epc_year_upper_bound"]
+                    <= self.EMPTY_CAVITY_YEAR_THRESHOLD
+                )
+                & (~self.standardised_asset_list[self.ATTRIBUTE_EPC_PRE_YEAR_THRESHOLD])
+                & (
+                    ~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(
+                        ["bedsit"]
+                    )
                 )
             )
 
         self.standardised_asset_list["landlord_data_indicates_empty_cavity"] = (
-            self.standardised_asset_list[self.STANDARD_WALL_CONSTRUCTION].isin(["uninsulated cavity"]) &
-            (
-                (self.standardised_asset_list[self.STANDARD_YEAR_BUILT] <= self.EMPTY_CAVITY_YEAR_THRESHOLD) |
-                (self.standardised_asset_list["epc_year_upper_bound"] <= self.EMPTY_CAVITY_YEAR_THRESHOLD)
-            ) & (
-                ~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(["bedsit"])
+            self.standardised_asset_list[self.STANDARD_WALL_CONSTRUCTION].isin(
+                ["uninsulated cavity"]
+            )
+            & (
+                (
+                    self.standardised_asset_list[self.STANDARD_YEAR_BUILT]
+                    <= self.EMPTY_CAVITY_YEAR_THRESHOLD
+                )
+                | (
+                    self.standardised_asset_list["epc_year_upper_bound"]
+                    <= self.EMPTY_CAVITY_YEAR_THRESHOLD
+                )
+            )
+            & (
+                ~self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE].isin(
+                    ["bedsit"]
+                )
             )
         )
 
         # Finally, we create a flag to indicate that the cavity is empty, based on the criteria above
         self.standardised_asset_list["cavity_is_empty"] = (
-            non_intrusives_wall_filter |
-            self.standardised_asset_list[self.EPC_API_DATA_NAMES["walls-description"]].str.lower().isin(
-                self.EPC_NO_WALL_INSULATION_DESCRIPTIONS
-            ) |
-            self.standardised_asset_list[self.STANDARD_WALL_CONSTRUCTION].isin(["uninsulated cavity"])
+            non_intrusives_wall_filter
+            | self.standardised_asset_list[self.EPC_API_DATA_NAMES["walls-description"]]
+            .str.lower()
+            .isin(self.EPC_NO_WALL_INSULATION_DESCRIPTIONS)
+            | self.standardised_asset_list[self.STANDARD_WALL_CONSTRUCTION].isin(
+                ["uninsulated cavity"]
+            )
         )
 
         ######################################################
@@ -1524,127 +1902,211 @@ class AssetList:
         if self.non_intrusives_present:
 
             extraction_wall_filter = (
-                (self.standardised_asset_list["non-intrusives: Construction"] == "CAVITY") &
-                (self.standardised_asset_list["non-intrusives: Insulated"].isin(["RETRO DRILLED", "FILLED AT BUILD"])) &
-                (~self.standardised_asset_list['non-intrusives: Material'].isin(
-                    ["GREY LOOSE BEAD", "COMPACTED BEAD", "FIBRE BATT NO CAVITY", "EMPTY NARROW BELOW 30mm"]
-                ))
+                (
+                    self.standardised_asset_list["non-intrusives: Construction"]
+                    == "CAVITY"
+                )
+                & (
+                    self.standardised_asset_list["non-intrusives: Insulated"].isin(
+                        ["RETRO DRILLED", "FILLED AT BUILD"]
+                    )
+                )
+                & (
+                    ~self.standardised_asset_list["non-intrusives: Material"].isin(
+                        [
+                            "GREY LOOSE BEAD",
+                            "COMPACTED BEAD",
+                            "FIBRE BATT NO CAVITY",
+                            "EMPTY NARROW BELOW 30mm",
+                        ]
+                    )
+                )
             )
 
             if self.non_intrusives_eligibility:
                 # If we have the eligibility column, we check if the wall is eligible
                 extraction_wall_filter = (
-                    extraction_wall_filter &
-                    ~self.standardised_asset_list["non-intrusives: Eligibility (Red/Yellow/Green)"].isin(
-                        ["RED"]
-                    )
+                    extraction_wall_filter
+                    & ~self.standardised_asset_list[
+                        "non-intrusives: Eligibility (Red/Yellow/Green)"
+                    ].isin(["RED"])
                 )
 
-            self.standardised_asset_list["non_intrusive_indicates_cavity_extraction"] = (
-                extraction_wall_filter & year_built_filter
-            )
-            self.standardised_asset_list["non_intrusive_indicates_cavity_extraction_no_year_filter"] = (
-                extraction_wall_filter & ~year_built_filter
-            )
+            self.standardised_asset_list[
+                "non_intrusive_indicates_cavity_extraction"
+            ] = (extraction_wall_filter & year_built_filter)
+            self.standardised_asset_list[
+                "non_intrusive_indicates_cavity_extraction_no_year_filter"
+            ] = (extraction_wall_filter & ~year_built_filter)
 
         elif self.old_format_non_intrusives_present:
             print("Review these categories!!!!")
             extraction_wall_filter = (
-                self.standardised_asset_list['non-intrusives: WFT Findings'].str.lower().str.strip().isin(
+                self.standardised_asset_list["non-intrusives: WFT Findings"]
+                .str.lower()
+                .str.strip()
+                .isin(
                     [
-                        'blown in yellow wool', 'retro drilled & filled', 'white fibre from build',
-                        'foam filled from build', 'retro drilled gas in block', 'block in rock wool', 'rdf / tilehung',
-                        'fibre from build', 'blown in rock wool', 'rdf / tile hung', 'retro drilled',
-                        'rock wool from build', 'part rendered retro drilled', 'white fibtr from build.',
-                        'retro drilled and filled', 'blown in white wool', 'blown in yellow fibre from build', 'rdf',
-                        'polybead', 'foam filled', 'blown in white bead from build', 'blown in yellow fibre',
-                        'retro drilled det', 'blown in rockwool', 'retro drilled det empty cav', 'retro drilled end',
-                        'retro filled extension', 'retro filled', 'foam'
+                        "blown in yellow wool",
+                        "retro drilled & filled",
+                        "white fibre from build",
+                        "foam filled from build",
+                        "retro drilled gas in block",
+                        "block in rock wool",
+                        "rdf / tilehung",
+                        "fibre from build",
+                        "blown in rock wool",
+                        "rdf / tile hung",
+                        "retro drilled",
+                        "rock wool from build",
+                        "part rendered retro drilled",
+                        "white fibtr from build.",
+                        "retro drilled and filled",
+                        "blown in white wool",
+                        "blown in yellow fibre from build",
+                        "rdf",
+                        "polybead",
+                        "foam filled",
+                        "blown in white bead from build",
+                        "blown in yellow fibre",
+                        "retro drilled det",
+                        "blown in rockwool",
+                        "retro drilled det empty cav",
+                        "retro drilled end",
+                        "retro filled extension",
+                        "retro filled",
+                        "foam",
                     ]
                 )
             )
 
-            self.standardised_asset_list["non_intrusive_indicates_cavity_extraction"] = (
-                extraction_wall_filter
-            )
-            self.standardised_asset_list["non_intrusive_indicates_cavity_extraction_no_year_filter"] = False
+            self.standardised_asset_list[
+                "non_intrusive_indicates_cavity_extraction"
+            ] = extraction_wall_filter
+            self.standardised_asset_list[
+                "non_intrusive_indicates_cavity_extraction_no_year_filter"
+            ] = False
 
         else:
-            self.standardised_asset_list["non_intrusive_indicates_cavity_extraction"] = False
-            self.standardised_asset_list["non_intrusive_indicates_cavity_extraction_no_year_filter"] = False
+            self.standardised_asset_list[
+                "non_intrusive_indicates_cavity_extraction"
+            ] = False
+            self.standardised_asset_list[
+                "non_intrusive_indicates_cavity_extraction_no_year_filter"
+            ] = False
 
         ######################################################
         # Solar
         ######################################################
         # Criteria:
         # Check 1: Does the property have a valid heating system?
-        self.standardised_asset_list["solar_landlord_data_indicates_correct_heating_system"] = (
-            self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM].isin(
-                [
-                    "air source heat pump",
-                    "ground source heat pump",
-                    "high heat retention storage heaters",
-                    "electric boiler"
-                ]
-            )
+        self.standardised_asset_list[
+            "solar_landlord_data_indicates_correct_heating_system"
+        ] = self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM].isin(
+            [
+                "air source heat pump",
+                "ground source heat pump",
+                "high heat retention storage heaters",
+                "electric boiler",
+            ]
         )
-        self.standardised_asset_list["solar_landlord_data_indicates_needs_heating_upgrade"] = (
-            self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM].isin(
-                ["electric storage heaters", "room heaters", "electric radiators", "no heating", "electric fuel"]
-            )
+        self.standardised_asset_list[
+            "solar_landlord_data_indicates_needs_heating_upgrade"
+        ] = self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM].isin(
+            [
+                "electric storage heaters",
+                "room heaters",
+                "electric radiators",
+                "no heating",
+                "electric fuel",
+            ]
         )
 
-        self.standardised_asset_list["solar_epc_data_indicates_correct_heating_system"] = (
-            (
-                self.standardised_asset_list[self.EPC_API_DATA_NAMES["mainheat-description"]]
-                .str.lower().str.contains("air source heat pump|ground source heat pump|boiler and radiators, electric")
-            ) | (
+        self.standardised_asset_list[
+            "solar_epc_data_indicates_correct_heating_system"
+        ] = (
+            self.standardised_asset_list[
+                self.EPC_API_DATA_NAMES["mainheat-description"]
+            ]
+            .str.lower()
+            .str.contains(
+                "air source heat pump|ground source heat pump|boiler and radiators, electric"
+            )
+        ) | (
+            self.standardised_asset_list[
+                self.EPC_API_DATA_NAMES["mainheat-description"]
+            ]
+            .str.lower()
+            .str.contains("electric storage heaters")
+            & (
                 self.standardised_asset_list[
-                    self.EPC_API_DATA_NAMES["mainheat-description"]].str.lower().str.contains(
-                    "electric storage heaters"
-                ) & (
-                    self.standardised_asset_list[self.EPC_API_DATA_NAMES[
-                        "mainheatcont-description"]] == "Controls for high heat retention storage heaters"
-                )
+                    self.EPC_API_DATA_NAMES["mainheatcont-description"]
+                ]
+                == "Controls for high heat retention storage heaters"
             )
         )
 
         # If the landlord has given us the heating system, we default to that on heating upgrades. Because of the
         # poor heating in place, if the EPC indicates that this property had a low efficiency heating system but the
         # landlord data suggests otherwise (e.g. there's a gas boiler), we default to what the landlord has told us
-        self.standardised_asset_list["solar_epc_data_indicates_requires_heating_upgrade"] = (
-            (
-                self.standardised_asset_list[self.EPC_API_DATA_NAMES["mainheat-description"]].str.lower().str.contains(
-                    "electric storage heaters|room heaters"
-                ) & (
-                    self.standardised_asset_list[
-                        self.EPC_API_DATA_NAMES["mainheatcont-description"]
-                    ] != "Controls for high heat retention storage heaters"
-                )
-            ) & (
-                ~self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM].isin(
-                    ["district heating", "communal heating", "communal gas boiler"]
-                ) & ~self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM].astype(str).str.contains("gas ")
+        self.standardised_asset_list[
+            "solar_epc_data_indicates_requires_heating_upgrade"
+        ] = (
+            self.standardised_asset_list[
+                self.EPC_API_DATA_NAMES["mainheat-description"]
+            ]
+            .str.lower()
+            .str.contains("electric storage heaters|room heaters")
+            & (
+                self.standardised_asset_list[
+                    self.EPC_API_DATA_NAMES["mainheatcont-description"]
+                ]
+                != "Controls for high heat retention storage heaters"
             )
+        ) & (
+            ~self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM].isin(
+                ["district heating", "communal heating", "communal gas boiler"]
+            )
+            & ~self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM]
+            .astype(str)
+            .str.contains("gas ")
         )
 
         # Basic check - both of the previous two shouldn't be true simultaneously
         if (
-            self.standardised_asset_list["solar_epc_data_indicates_correct_heating_system"] &
-            self.standardised_asset_list["solar_epc_data_indicates_requires_heating_upgrade"]
+            self.standardised_asset_list[
+                "solar_epc_data_indicates_correct_heating_system"
+            ]
+            & self.standardised_asset_list[
+                "solar_epc_data_indicates_requires_heating_upgrade"
+            ]
         ).sum():
-            logger.info("We have an example of both heating system checks being true - checking known cases")
-            known_edge_cases = ['Ground source heat pump, radiators, electric, Electric storage heaters']
+            logger.info(
+                "We have an example of both heating system checks being true - checking known cases"
+            )
+            known_edge_cases = [
+                "Ground source heat pump, radiators, electric, Electric storage heaters"
+            ]
             error_cases = self.standardised_asset_list[
                 (
-                    self.standardised_asset_list["solar_epc_data_indicates_correct_heating_system"] &
-                    self.standardised_asset_list["solar_epc_data_indicates_requires_heating_upgrade"]
+                    self.standardised_asset_list[
+                        "solar_epc_data_indicates_correct_heating_system"
+                    ]
+                    & self.standardised_asset_list[
+                        "solar_epc_data_indicates_requires_heating_upgrade"
+                    ]
                 )
             ]
-            if all(error_cases[self.EPC_API_DATA_NAMES["mainheat-description"]].isin(known_edge_cases)):
+            if all(
+                error_cases[self.EPC_API_DATA_NAMES["mainheat-description"]].isin(
+                    known_edge_cases
+                )
+            ):
                 logger.info("Within known edge cases")
             else:
-                raise ValueError("Both heating system checks are true - this should not be possible")
+                raise ValueError(
+                    "Both heating system checks are true - this should not be possible"
+                )
 
         # Check 3: Does the property meet the fabric condition
         # Solar PV installs are subject to the minimum insulation requirements which means:
@@ -1663,19 +2125,19 @@ class AssetList:
         # With this in mind, we look for 2 clases
         # 1) The property is fully insulated apart from the loft (<200mm insulation)
         # 2) THe property is fully insulated
-        self.standardised_asset_list["solar_landlord_walls_insulated"] = (
-            self.standardised_asset_list[self.STANDARD_WALL_CONSTRUCTION].isin(
-                [
-                    "filled cavity",
-                    "insulated solid brick",
-                    "insulated timber frame",
-                    "uninsulated cavity",
-                    "insulated system built",
-                    "insulated granite or whinstone",
-                    "insulated sandstone or limestone",
-                    "new build - average thermal transmittance"
-                ]
-            )
+        self.standardised_asset_list[
+            "solar_landlord_walls_insulated"
+        ] = self.standardised_asset_list[self.STANDARD_WALL_CONSTRUCTION].isin(
+            [
+                "filled cavity",
+                "insulated solid brick",
+                "insulated timber frame",
+                "uninsulated cavity",
+                "insulated system built",
+                "insulated granite or whinstone",
+                "insulated sandstone or limestone",
+                "new build - average thermal transmittance",
+            ]
         )
 
         if self.non_intrusives_present:
@@ -1685,31 +2147,43 @@ class AssetList:
                 )
             )
         elif self.old_format_non_intrusives_present:
-            self.standardised_asset_list["solar_non_intrusives_walls_insulated"] = (
-                self.standardised_asset_list["non-intrusives: WFT Findings"].str.lower().str.strip().isin(
-                    [
-                        "retro drilled", "retro filled", "ewi", "retro drilled/ solid", "retro drilled and filled",
-                    ]
-                ) |
-                self.standardised_asset_list["non-intrusives: WFT Findings"].str.lower().str.strip().str.contains(
-                    "retro drilled"
-                )
+            self.standardised_asset_list[
+                "solar_non_intrusives_walls_insulated"
+            ] = self.standardised_asset_list[
+                "non-intrusives: WFT Findings"
+            ].str.lower().str.strip().isin(
+                [
+                    "retro drilled",
+                    "retro filled",
+                    "ewi",
+                    "retro drilled/ solid",
+                    "retro drilled and filled",
+                ]
+            ) | self.standardised_asset_list[
+                "non-intrusives: WFT Findings"
+            ].str.lower().str.strip().str.contains(
+                "retro drilled"
             )
         else:
             self.standardised_asset_list["solar_non_intrusives_walls_insulated"] = False
 
         self.standardised_asset_list["walls_u_value"] = self.standardised_asset_list[
             self.EPC_API_DATA_NAMES["walls-description"]
-        ].apply(lambda x: WallAttributes(x).process()["thermal_transmittance"] if not pd.isnull(x) else None)
+        ].apply(
+            lambda x: (
+                WallAttributes(x).process()["thermal_transmittance"]
+                if not pd.isnull(x)
+                else None
+            )
+        )
 
         self.standardised_asset_list["solar_epc_walls_insulated"] = (
-            (
-                self.standardised_asset_list[
-                    self.EPC_API_DATA_NAMES["walls-description"]].str.lower().str.contains(
-                    "|".join(self.EPC_INSULATED_WALLS_SUBSTRINGS)
-                )
-            ) | (
-                self.standardised_asset_list["walls_u_value"].apply(lambda x: x <= 0.7 if not pd.isnull(x) else False)
+            self.standardised_asset_list[self.EPC_API_DATA_NAMES["walls-description"]]
+            .str.lower()
+            .str.contains("|".join(self.EPC_INSULATED_WALLS_SUBSTRINGS))
+        ) | (
+            self.standardised_asset_list["walls_u_value"].apply(
+                lambda x: x <= 0.7 if not pd.isnull(x) else False
             )
         )
 
@@ -1722,7 +2196,7 @@ class AssetList:
             roof_data.append(
                 {
                     self.EPC_API_DATA_NAMES["roof-description"]: desc,
-                    **RoofAttributes(desc).process()
+                    **RoofAttributes(desc).process(),
                 }
             )
         roof_data = pd.DataFrame(roof_data)
@@ -1733,31 +2207,38 @@ class AssetList:
 
         # If the u-value of a roof is less than 0.7 we consider it insulated
         self.standardised_asset_list["solar_epc_roof_insulated"] = (
-            self.standardised_asset_list[self.EPC_API_DATA_NAMES["roof-description"]].str.lower().str.contains(
+            self.standardised_asset_list[self.EPC_API_DATA_NAMES["roof-description"]]
+            .str.lower()
+            .str.contains(
                 "|".join(self.EPC_INSULATED_ROOF_SUBSTRINGS),
-            ) | (
-                self.standardised_asset_list[self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS].apply(
-                    lambda x: int(x) >= 200 if str(x).isdigit() else False
-                )
-            ) | (
+            )
+            | (
+                self.standardised_asset_list[
+                    self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS
+                ].apply(lambda x: int(x) >= 200 if str(x).isdigit() else False)
+            )
+            | (
                 self.standardised_asset_list["roof_u_value"].apply(
                     lambda x: x <= 0.7 if not pd.isnull(x) else False
                 )
             )
         )
 
-        self.standardised_asset_list["solar_epc_loft_needs_topup"] = (
-            self.standardised_asset_list[
-                self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS].apply(
-                lambda x: int(x) < 200 if str(x).isdigit() else False
-            ) | (
-                (
-                    self.standardised_asset_list["is_loft"] | self.standardised_asset_list["is_pitched"]
-                ) & (
-                    self.standardised_asset_list[self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS].isin(
-                        ["below average", "none"]
-                    )
-                )
+        self.standardised_asset_list[
+            "solar_epc_loft_needs_topup"
+        ] = self.standardised_asset_list[
+            self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS
+        ].apply(
+            lambda x: int(x) < 200 if str(x).isdigit() else False
+        ) | (
+            (
+                self.standardised_asset_list["is_loft"]
+                | self.standardised_asset_list["is_pitched"]
+            )
+            & (
+                self.standardised_asset_list[
+                    self.ATTRIBUTE_EPC_ROOF_INSULATION_THICKNESS
+                ].isin(["below average", "none"])
             )
         )
 
@@ -1768,13 +2249,14 @@ class AssetList:
         # Check if the boiler is electric
         # We check if it contains both the terms boiler & electric
         self.standardised_asset_list["has_electric_boiler"] = (
-            (
-                self.standardised_asset_list[self.EPC_API_DATA_NAMES["mainheat-description"]]
-                .str.lower().isin(
-                    ["boiler and radiators, electric"])
-            ) | (
-                self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM] == "electric boiler"
-            )
+            self.standardised_asset_list[
+                self.EPC_API_DATA_NAMES["mainheat-description"]
+            ]
+            .str.lower()
+            .isin(["boiler and radiators, electric"])
+        ) | (
+            self.standardised_asset_list[self.STANDARD_HEATING_SYSTEM]
+            == "electric boiler"
         )
 
         ####################################
@@ -1783,14 +2265,22 @@ class AssetList:
 
         # Set up the filters to stop repetition
         correct_heating_system = (
-            self.standardised_asset_list["solar_landlord_data_indicates_correct_heating_system"] |
-            self.standardised_asset_list["solar_epc_data_indicates_correct_heating_system"] |
-            self.standardised_asset_list["has_electric_boiler"]
+            self.standardised_asset_list[
+                "solar_landlord_data_indicates_correct_heating_system"
+            ]
+            | self.standardised_asset_list[
+                "solar_epc_data_indicates_correct_heating_system"
+            ]
+            | self.standardised_asset_list["has_electric_boiler"]
         )
 
         needs_heating_upgrade = (
-            self.standardised_asset_list["solar_landlord_data_indicates_needs_heating_upgrade"] |
-            self.standardised_asset_list["solar_epc_data_indicates_requires_heating_upgrade"]
+            self.standardised_asset_list[
+                "solar_landlord_data_indicates_needs_heating_upgrade"
+            ]
+            | self.standardised_asset_list[
+                "solar_epc_data_indicates_requires_heating_upgrade"
+            ]
         )
 
         # The requirements for walls are:
@@ -1799,13 +2289,17 @@ class AssetList:
 
         walls_meet_solar_requirements = (
             # The landlord is saying the walls are insulated
-            self.standardised_asset_list["solar_landlord_walls_insulated"] |
+            self.standardised_asset_list["solar_landlord_walls_insulated"]
+            |
             # EPC data is saying the walls are insulated
-            self.standardised_asset_list["solar_epc_walls_insulated"] |
+            self.standardised_asset_list["solar_epc_walls_insulated"]
+            |
             # Non-intrusives are saying the walls are insulated
-            self.standardised_asset_list["solar_non_intrusives_walls_insulated"] |
+            self.standardised_asset_list["solar_non_intrusives_walls_insulated"]
+            |
             # It's empty cavity
-            self.standardised_asset_list["cavity_is_empty"] |
+            self.standardised_asset_list["cavity_is_empty"]
+            |
             # It's a cavity wall
             self.standardised_asset_list[self.STANDARD_WALL_CONSTRUCTION].isin(
                 ["filled cavity", "partial insulated cavity"]
@@ -1816,7 +2310,8 @@ class AssetList:
         if all(self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE] == "unknown"):
             # Use EPC
             not_a_flat = (
-                self.standardised_asset_list[self.EPC_API_DATA_NAMES["property-type"]] != "Flat"
+                self.standardised_asset_list[self.EPC_API_DATA_NAMES["property-type"]]
+                != "Flat"
             )
         else:
             not_a_flat = (
@@ -1824,32 +2319,40 @@ class AssetList:
             )
 
         solar_roof_meets_criteria = (
-            self.standardised_asset_list["solar_epc_roof_insulated"] |
-            self.standardised_asset_list["solar_epc_loft_needs_topup"]
+            self.standardised_asset_list["solar_epc_roof_insulated"]
+            | self.standardised_asset_list["solar_epc_loft_needs_topup"]
         )
 
         self.standardised_asset_list["solar_eligible"] = (
             # Property isn't a flag
-            not_a_flat &
+            not_a_flat
+            &
             # Landlord data or EPC data indicates the heating system is appropriate
-            correct_heating_system &
+            correct_heating_system
+            &
             # The property doesn't currently have solar
-            ~self.standardised_asset_list["property_has_solar"] &
+            ~self.standardised_asset_list["property_has_solar"]
+            &
             # The walls are insulated
-            walls_meet_solar_requirements &
+            walls_meet_solar_requirements
+            &
             # Roof meets criteria
             solar_roof_meets_criteria
         )
 
         # With heating upgrade
         self.standardised_asset_list["solar_eligible_needs_heating_upgrade"] = (
-            not_a_flat &
+            not_a_flat
+            &
             # Needs heating upgrade
-            needs_heating_upgrade &
+            needs_heating_upgrade
+            &
             # The property doesn't currently have solar
-            ~self.standardised_asset_list["property_has_solar"] &
+            ~self.standardised_asset_list["property_has_solar"]
+            &
             # The walls are insulated
-            walls_meet_solar_requirements &
+            walls_meet_solar_requirements
+            &
             # Roof meets criteria
             solar_roof_meets_criteria
         )
@@ -1857,15 +2360,23 @@ class AssetList:
         # We check for a specific sub-set of properties which are uninsulated solid wall properties that are EPC E
         # or below (we'll use 57 as a threshold) - These are for a pilot with Net Zero Renewables
         self.standardised_asset_list["solar_eligible_solid_wall_uninsulated"] = (
-            not_a_flat &
+            not_a_flat
+            &
             # Landlord data or EPC data indicates the heating system is appropriate - in this case, we can also take
             # electric boilers
-            correct_heating_system &
+            correct_heating_system
+            &
             # The property doesn't currently have solar
-            ~self.standardised_asset_list["property_has_solar"] &
+            ~self.standardised_asset_list["property_has_solar"]
+            &
             # The walls are uninsulated solid
-            ~walls_meet_solar_requirements &
-            (self.standardised_asset_list[self.EPC_API_DATA_NAMES["current-energy-efficiency"]] <= 57)
+            ~walls_meet_solar_requirements
+            & (
+                self.standardised_asset_list[
+                    self.EPC_API_DATA_NAMES["current-energy-efficiency"]
+                ]
+                <= 57
+            )
         )
 
         # Drop anything we don't need
@@ -1875,100 +2386,128 @@ class AssetList:
 
         # Adjust flagged extraction jobs to remove anything for solar
         self.standardised_asset_list["non_intrusive_indicates_cavity_extraction"] = (
-            self.standardised_asset_list["non_intrusive_indicates_cavity_extraction"] &
-            ~self.standardised_asset_list["solar_eligible"]
+            self.standardised_asset_list["non_intrusive_indicates_cavity_extraction"]
+            & ~self.standardised_asset_list["solar_eligible"]
         )
 
         # Finally, we note why each property has been flagged
         self.standardised_asset_list["cavity_reason"] = None
 
         empty_cavity_map = {
-            "non_intrusive_indicates_empty_cavity": self.EMPTY_CAVITY_NON_INTRUSIVE + ": ",
+            "non_intrusive_indicates_empty_cavity": self.EMPTY_CAVITY_NON_INTRUSIVE
+            + ": ",
             "non_intrusive_indicates_empty_cavity_has_solar": f"{self.EMPTY_CAVITY_NON_INTRUSIVE} - property "
-                                                              "already has solar: ",
+            "already has solar: ",
             "non_intrusive_indicates_empty_cavity_no_year_filter": f"{self.EMPTY_CAVITY_NON_INTRUSIVE}, "
-                                                                   f"built after {self.EMPTY_CAVITY_YEAR_THRESHOLD}: ",
-
+            f"built after {self.EMPTY_CAVITY_YEAR_THRESHOLD}: ",
         }
         for variable, description in empty_cavity_map.items():
             self.standardised_asset_list["cavity_reason"] = np.where(
-                self.standardised_asset_list[variable] &
-                pd.isnull(self.standardised_asset_list["cavity_reason"]),
+                self.standardised_asset_list[variable]
+                & pd.isnull(self.standardised_asset_list["cavity_reason"]),
                 description + self.standardised_asset_list["SAP Category"],
-                self.standardised_asset_list["cavity_reason"]
+                self.standardised_asset_list["cavity_reason"],
             )
 
         # We break the cavity reason into a few different categories, when the EPC is different from inspections
         if self.old_format_non_intrusives_present:
             self.standardised_asset_list["cavity_reason"] = np.where(
                 (
-                    self.standardised_asset_list["epc_indicates_empty_cavity"] &
-                    ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] &
-                    (self.standardised_asset_list['non-intrusives: WFT Findings'].str.lower().str.strip().isin(
-                        [
-                            "retro drilled and filled", "retro drilled", "retro filled", "retro drilled & filled",
-                        ]
-                    )) &
-                    pd.isnull(self.standardised_asset_list["cavity_reason"])
+                    self.standardised_asset_list["epc_indicates_empty_cavity"]
+                    & ~self.standardised_asset_list[
+                        "non_intrusive_indicates_empty_cavity"
+                    ]
+                    & (
+                        self.standardised_asset_list["non-intrusives: WFT Findings"]
+                        .str.lower()
+                        .str.strip()
+                        .isin(
+                            [
+                                "retro drilled and filled",
+                                "retro drilled",
+                                "retro filled",
+                                "retro drilled & filled",
+                            ]
+                        )
+                    )
+                    & pd.isnull(self.standardised_asset_list["cavity_reason"])
                 ),
-                f"{self.EPC_EMPTY_INSPECTIONS_RETRO_DRILLED}: " + self.standardised_asset_list[
-                    "SAP Category"],
-                self.standardised_asset_list["cavity_reason"]
+                f"{self.EPC_EMPTY_INSPECTIONS_RETRO_DRILLED}: "
+                + self.standardised_asset_list["SAP Category"],
+                self.standardised_asset_list["cavity_reason"],
             )
 
             self.standardised_asset_list["cavity_reason"] = np.where(
                 (
-                    self.standardised_asset_list["epc_indicates_empty_cavity"] &
-                    ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] &
-                    self.standardised_asset_list['non_intrusive_indicates_cavity_extraction'] &
-                    pd.isnull(self.standardised_asset_list["cavity_reason"])
+                    self.standardised_asset_list["epc_indicates_empty_cavity"]
+                    & ~self.standardised_asset_list[
+                        "non_intrusive_indicates_empty_cavity"
+                    ]
+                    & self.standardised_asset_list[
+                        "non_intrusive_indicates_cavity_extraction"
+                    ]
+                    & pd.isnull(self.standardised_asset_list["cavity_reason"])
                 ),
-                f"{self.EPC_EMPTY_INSPECTIONS_FILLED}: " + self.standardised_asset_list[
-                    "SAP Category"],
-                self.standardised_asset_list["cavity_reason"]
+                f"{self.EPC_EMPTY_INSPECTIONS_FILLED}: "
+                + self.standardised_asset_list["SAP Category"],
+                self.standardised_asset_list["cavity_reason"],
             )
         elif self.non_intrusives_present:
             self.standardised_asset_list["cavity_reason"] = np.where(
                 (
-                    self.standardised_asset_list["epc_indicates_empty_cavity"] &
-                    ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] &
-                    (self.standardised_asset_list['non-intrusives: Insulated'] == "RETRO DRILLED") &
-                    pd.isnull(self.standardised_asset_list["cavity_reason"])
+                    self.standardised_asset_list["epc_indicates_empty_cavity"]
+                    & ~self.standardised_asset_list[
+                        "non_intrusive_indicates_empty_cavity"
+                    ]
+                    & (
+                        self.standardised_asset_list["non-intrusives: Insulated"]
+                        == "RETRO DRILLED"
+                    )
+                    & pd.isnull(self.standardised_asset_list["cavity_reason"])
                 ),
-                f"{self.EPC_EMPTY_INSPECTIONS_RETRO_DRILLED}: " + self.standardised_asset_list[
-                    "SAP Category"],
-                self.standardised_asset_list["cavity_reason"]
+                f"{self.EPC_EMPTY_INSPECTIONS_RETRO_DRILLED}: "
+                + self.standardised_asset_list["SAP Category"],
+                self.standardised_asset_list["cavity_reason"],
             )
 
             self.standardised_asset_list["cavity_reason"] = np.where(
                 (
-                    self.standardised_asset_list["epc_indicates_empty_cavity"] &
-                    ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] &
-                    (self.standardised_asset_list['non-intrusives: Insulated'] == "FILLED AT BUILD") &
-                    pd.isnull(self.standardised_asset_list["cavity_reason"])
+                    self.standardised_asset_list["epc_indicates_empty_cavity"]
+                    & ~self.standardised_asset_list[
+                        "non_intrusive_indicates_empty_cavity"
+                    ]
+                    & (
+                        self.standardised_asset_list["non-intrusives: Insulated"]
+                        == "FILLED AT BUILD"
+                    )
+                    & pd.isnull(self.standardised_asset_list["cavity_reason"])
                 ),
-                f"{self.EPC_EMPTY_INSPECTIONS_FILLED_AT_BUILD}: " + self.standardised_asset_list["SAP Category"],
-                self.standardised_asset_list["cavity_reason"]
+                f"{self.EPC_EMPTY_INSPECTIONS_FILLED_AT_BUILD}: "
+                + self.standardised_asset_list["SAP Category"],
+                self.standardised_asset_list["cavity_reason"],
             )
         else:
             self.standardised_asset_list["cavity_reason"] = np.where(
                 (
-                    self.standardised_asset_list["epc_indicates_empty_cavity"] &
-                    ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] &
-                    pd.isnull(self.standardised_asset_list["cavity_reason"])
+                    self.standardised_asset_list["epc_indicates_empty_cavity"]
+                    & ~self.standardised_asset_list[
+                        "non_intrusive_indicates_empty_cavity"
+                    ]
+                    & pd.isnull(self.standardised_asset_list["cavity_reason"])
                 ),
                 f"{self.EPC_EMPTY}: " + self.standardised_asset_list["SAP Category"],
-                self.standardised_asset_list["cavity_reason"]
+                self.standardised_asset_list["cavity_reason"],
             )
 
         self.standardised_asset_list["cavity_reason"] = np.where(
             (
-                self.standardised_asset_list["epc_indicates_empty_cavity"] &
-                ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] &
-                pd.isnull(self.standardised_asset_list["cavity_reason"])
+                self.standardised_asset_list["epc_indicates_empty_cavity"]
+                & ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"]
+                & pd.isnull(self.standardised_asset_list["cavity_reason"])
             ),
-            f"{self.EPC_EMPTY_INSPECTIONS_NON_CAVITY}: " + self.standardised_asset_list["SAP Category"],
-            self.standardised_asset_list["cavity_reason"]
+            f"{self.EPC_EMPTY_INSPECTIONS_NON_CAVITY}: "
+            + self.standardised_asset_list["SAP Category"],
+            self.standardised_asset_list["cavity_reason"],
         )
 
         # Work type prefixes
@@ -1977,34 +2516,39 @@ class AssetList:
         # inspections show filled
         self.standardised_asset_list["cavity_reason"] = np.where(
             (
-                self.standardised_asset_list["landlord_data_indicates_empty_cavity"] &
-                ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"] &
-                ~self.standardised_asset_list["epc_indicates_empty_cavity"] &
-                pd.isnull(self.standardised_asset_list["cavity_reason"])
+                self.standardised_asset_list["landlord_data_indicates_empty_cavity"]
+                & ~self.standardised_asset_list["non_intrusive_indicates_empty_cavity"]
+                & ~self.standardised_asset_list["epc_indicates_empty_cavity"]
+                & pd.isnull(self.standardised_asset_list["cavity_reason"])
             ),
-            f"{self.LANDLORD_EMPTY_INSPECTIONS_OTHER}: " +
-            self.standardised_asset_list["SAP Category"],
-            self.standardised_asset_list["cavity_reason"]
+            f"{self.LANDLORD_EMPTY_INSPECTIONS_OTHER}: "
+            + self.standardised_asset_list["SAP Category"],
+            self.standardised_asset_list["cavity_reason"],
         )
 
         # Flag extraction
         self.standardised_asset_list["cavity_reason"] = np.where(
             (
-                self.standardised_asset_list["non_intrusive_indicates_cavity_extraction"] &
-                pd.isnull(self.standardised_asset_list["cavity_reason"])
+                self.standardised_asset_list[
+                    "non_intrusive_indicates_cavity_extraction"
+                ]
+                & pd.isnull(self.standardised_asset_list["cavity_reason"])
             ),
-            f"{self.EXTRACTION_NON_INTRUSIVE}: " + self.standardised_asset_list["SAP Category"],
-            self.standardised_asset_list["cavity_reason"]
+            f"{self.EXTRACTION_NON_INTRUSIVE}: "
+            + self.standardised_asset_list["SAP Category"],
+            self.standardised_asset_list["cavity_reason"],
         )
 
         self.standardised_asset_list["cavity_reason"] = np.where(
             (
-                self.standardised_asset_list["non_intrusive_indicates_cavity_extraction_no_year_filter"] &
-                pd.isnull(self.standardised_asset_list["cavity_reason"])
+                self.standardised_asset_list[
+                    "non_intrusive_indicates_cavity_extraction_no_year_filter"
+                ]
+                & pd.isnull(self.standardised_asset_list["cavity_reason"])
             ),
-            f"{self.EXTRACTION_NON_INTRUSIVE}, built after {self.EMPTY_CAVITY_YEAR_THRESHOLD}: " +
-            self.standardised_asset_list["SAP Category"],
-            self.standardised_asset_list["cavity_reason"]
+            f"{self.EXTRACTION_NON_INTRUSIVE}, built after {self.EMPTY_CAVITY_YEAR_THRESHOLD}: "
+            + self.standardised_asset_list["SAP Category"],
+            self.standardised_asset_list["cavity_reason"],
         )
 
         ######################################################
@@ -2017,76 +2561,82 @@ class AssetList:
         solar_reason_map = {
             "solar_eligible": f"{self.SOLAR_ELIGIBLE}: ",
             "solar_eligible_solid_wall_uninsulated": f"{self.SOLAR_ELIGIBLE_SOLID_WALL_UNINSULATED}: ",
-            "solar_eligible_needs_heating_upgrade": f"{self.SOLAR_ELIGIBLE_NEEDS_HEATING_UPGRADE}: "
+            "solar_eligible_needs_heating_upgrade": f"{self.SOLAR_ELIGIBLE_NEEDS_HEATING_UPGRADE}: ",
         }
 
         for variable, reason in solar_reason_map.items():
             self.standardised_asset_list["solar_reason"] = np.where(
-                self.standardised_asset_list[variable] & pd.isnull(self.standardised_asset_list["solar_reason"]),
+                self.standardised_asset_list[variable]
+                & pd.isnull(self.standardised_asset_list["solar_reason"]),
                 reason + self.standardised_asset_list["SAP Category"],
-                self.standardised_asset_list["solar_reason"]
+                self.standardised_asset_list["solar_reason"],
             )
 
         # Finally, anything flagged for solar should not be flagged for cavity - make them None
         self.standardised_asset_list["cavity_reason"] = np.where(
             (
-                ~pd.isnull(self.standardised_asset_list["solar_reason"]) &
-                ~pd.isnull(self.standardised_asset_list["cavity_reason"])
+                ~pd.isnull(self.standardised_asset_list["solar_reason"])
+                & ~pd.isnull(self.standardised_asset_list["cavity_reason"])
             ),
             None,
-            self.standardised_asset_list["cavity_reason"]
+            self.standardised_asset_list["cavity_reason"],
         )
 
         # Flag anything that has existing outcomes
-        if (self.outcomes is not None) and ("surveyed" in self.standardised_asset_list.columns):
+        if (self.outcomes is not None) and (
+            "surveyed" in self.standardised_asset_list.columns
+        ):
 
             if "installer refusal" not in self.standardised_asset_list.columns:
                 self.standardised_asset_list["cavity_reason"] = np.where(
-                    (
-                        (self.standardised_asset_list["surveyed"] > 0)
-                    ),
+                    ((self.standardised_asset_list["surveyed"] > 0)),
                     None,
-                    self.standardised_asset_list["cavity_reason"]
+                    self.standardised_asset_list["cavity_reason"],
                 )
             else:
                 for col in ["cavity_reason", "solar_reason"]:
                     self.standardised_asset_list[col] = np.where(
                         (
-                            (self.standardised_asset_list["surveyed"] > 0) |
-                            (self.standardised_asset_list["installer refusal"] > 0)
+                            (self.standardised_asset_list["surveyed"] > 0)
+                            | (self.standardised_asset_list["installer refusal"] > 0)
                         ),
                         None,
-                        self.standardised_asset_list[col]
+                        self.standardised_asset_list[col],
                     )
 
         if self.master_surveyed is not None:
             for col in ["cavity_reason", "solar_reason"]:
                 self.standardised_asset_list[col] = np.where(
-                    (
-                        (~pd.isnull(self.standardised_asset_list["submission_status"]))
-                    ),
+                    ((~pd.isnull(self.standardised_asset_list["submission_status"]))),
                     None,
-                    self.standardised_asset_list[col]
+                    self.standardised_asset_list[col],
                 )
 
-        if self.ecosurv is not None and "ecosurv_install_status" in self.standardised_asset_list.columns:
+        if (
+            self.ecosurv is not None
+            and "ecosurv_install_status" in self.standardised_asset_list.columns
+        ):
             # If we didn't match anything to ecosurv, the ecosurv_install_status won't exist
             for col in ["cavity_reason", "solar_reason"]:
                 self.standardised_asset_list[col] = np.where(
                     (
-                        (~pd.isnull(self.standardised_asset_list["ecosurv_install_status"]))
+                        (
+                            ~pd.isnull(
+                                self.standardised_asset_list["ecosurv_install_status"]
+                            )
+                        )
                     ),
                     None,
-                    self.standardised_asset_list[col]
+                    self.standardised_asset_list[col],
                 )
 
         # We prepare outcomes for output
         if self.outcomes is not None:
             logger.info("Preparing outcomes for output")
             identified_work = self.standardised_asset_list[
-                ~pd.isnull(self.standardised_asset_list["cavity_reason"]) |
-                ~pd.isnull(self.standardised_asset_list["solar_reason"])
-                ][self.DOMNA_PROPERTY_ID].values
+                ~pd.isnull(self.standardised_asset_list["cavity_reason"])
+                | ~pd.isnull(self.standardised_asset_list["solar_reason"])
+            ][self.DOMNA_PROPERTY_ID].values
 
             if self.DOMNA_PROPERTY_ID in self.outcomes.columns:
                 self.outcomes_for_output = self.outcomes[
@@ -2096,37 +2646,49 @@ class AssetList:
         # Finally, direct operations feedback has suggested that if a property is a flat that has a SAP rating of
         # 76 or above, we should exclude it because it's likely not going to be eligible for anyting
         self.standardised_asset_list["cavity_reason"] = np.where(
-            (self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE] == "flat") &
-            (self.standardised_asset_list["SAP Category"] == "SAP Rating 76 or more"),
+            (self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE] == "flat")
+            & (self.standardised_asset_list["SAP Category"] == "SAP Rating 76 or more"),
             self.standardised_asset_list["cavity_reason"] + " - (unlikely to quality)",
-            self.standardised_asset_list["cavity_reason"]
+            self.standardised_asset_list["cavity_reason"],
         )
 
         # Split cavity_reason on the colon and check if the first part is equal to one of the two options above
         # that indicates empties
         self.standardised_asset_list["identified_empty_cavity"] = (
-            self.standardised_asset_list["cavity_reason"].str.split(":").str[0].isin(
-                [self.EMPTY_CAVITY_NON_INTRUSIVE, self.EMPTY_CAVITY_NON_INTRUSIVE_YEAR, self.EPC_EMPTY]
+            self.standardised_asset_list["cavity_reason"]
+            .str.split(":")
+            .str[0]
+            .isin(
+                [
+                    self.EMPTY_CAVITY_NON_INTRUSIVE,
+                    self.EMPTY_CAVITY_NON_INTRUSIVE_YEAR,
+                    self.EPC_EMPTY,
+                ]
             )
         )
 
     def get_work_figures(self):
         blocks_of_flats = self.standardised_asset_list[
-            self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE] == "block of flats"
-            ]
+            self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE]
+            == "block of flats"
+        ]
 
         non_blocks_of_flats = self.standardised_asset_list[
-            self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE] != "block of flats"
-            ]
+            self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE]
+            != "block of flats"
+        ]
 
         # Produce some aggregate figures
         self.work_type_figures = {
             **non_blocks_of_flats["cavity_reason"].value_counts().to_dict(),
             **{
-                k + " (Block of flats)": v for k, v in
-                blocks_of_flats["solar_reason"].value_counts().to_dict().items()
+                k + " (Block of flats)": v
+                for k, v in blocks_of_flats["solar_reason"]
+                .value_counts()
+                .to_dict()
+                .items()
             },
-            **self.standardised_asset_list["solar_reason"].value_counts().to_dict()
+            **self.standardised_asset_list["solar_reason"].value_counts().to_dict(),
         }
         pprint(self.work_type_figures)
 
@@ -2136,12 +2698,15 @@ class AssetList:
 
         # If we have blocks of flats, we fill the landlord_block_reference field with address 1 + postcode
         self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE] = np.where(
-            (self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE] == "block of flats") & (
-                pd.isnull(self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE])
-            ),
-            self.standardised_asset_list[self.STANDARD_ADDRESS_1] + " " +
-            self.standardised_asset_list[self.STANDARD_POSTCODE],
-            self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE]
+            (
+                self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE]
+                == "block of flats"
+            )
+            & (pd.isnull(self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE])),
+            self.standardised_asset_list[self.STANDARD_ADDRESS_1]
+            + " "
+            + self.standardised_asset_list[self.STANDARD_POSTCODE],
+            self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE],
         )
 
     def split_blocks(self):
@@ -2152,16 +2717,21 @@ class AssetList:
         """
 
         blocks = self.standardised_asset_list[
-            self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE] == "block of flats"
-            ].copy()
+            self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE]
+            == "block of flats"
+        ].copy()
 
         if blocks.empty:
             return
 
-        RANGE_RE = re.compile(r'\b(\d+[A-Za-z]?)\s*[-–]\s*(\d+[A-Za-z]?)\b')
-        NUM_RE = re.compile(r'\b\d+[A-Za-z]?\b')  # captures 12, 12A, etc.
-        TO_RANGE_RE = re.compile(r'\b(\d+[A-Za-z]?)\s+(?:to|To|TO)\s+(\d+[A-Za-z]?)\b')  # captures "13 to 15"
-        LETTER_RANGE_RE = re.compile(r'\b(\d+)([A-Za-z]?)\s*[-–]\s*(\d+)([A-Za-z]?)\b')  # captures "1A-3B"
+        RANGE_RE = re.compile(r"\b(\d+[A-Za-z]?)\s*[-–]\s*(\d+[A-Za-z]?)\b")
+        NUM_RE = re.compile(r"\b\d+[A-Za-z]?\b")  # captures 12, 12A, etc.
+        TO_RANGE_RE = re.compile(
+            r"\b(\d+[A-Za-z]?)\s+(?:to|To|TO)\s+(\d+[A-Za-z]?)\b"
+        )  # captures "13 to 15"
+        LETTER_RANGE_RE = re.compile(
+            r"\b(\d+)([A-Za-z]?)\s*[-–]\s*(\d+)([A-Za-z]?)\b"
+        )  # captures "1A-3B"
 
         expanded_rows = []
 
@@ -2172,16 +2742,16 @@ class AssetList:
             # We also look for terms like "Odd", "even", "all" in the address to indicate if it should be just
             # the odds, evens or all of the numbers
             has_odd = (
-                "(odd)" in addr.lower() or
-                "(odd)" in full_addr.lower() or
-                "(odds)" in addr.lower() or
-                "(odds)" in full_addr.lower()
+                "(odd)" in addr.lower()
+                or "(odd)" in full_addr.lower()
+                or "(odds)" in addr.lower()
+                or "(odds)" in full_addr.lower()
             )
             has_even = (
-                "(even)" in addr.lower() or
-                "(even)" in full_addr.lower() or
-                "(evens)" in addr.lower() or
-                "(evens)" in full_addr.lower()
+                "(even)" in addr.lower()
+                or "(even)" in full_addr.lower()
+                or "(evens)" in addr.lower()
+                or "(evens)" in full_addr.lower()
             )
 
             # 1 ─ Range  (e.g. 1-7)
@@ -2190,7 +2760,9 @@ class AssetList:
 
             if m_range or to_range:
                 start, end = m_range.groups() if m_range else to_range.groups()
-                start, end = int(re.match(r'\d+', start)[0]), int(re.match(r'\d+', end)[0])
+                start, end = int(re.match(r"\d+", start)[0]), int(
+                    re.match(r"\d+", end)[0]
+                )
                 if start > end or (end - start) > 200:
                     raise ValueError(f"Suspicious range '{addr}'")
 
@@ -2217,18 +2789,26 @@ class AssetList:
                     new["is_expended_block"] = True
                     # We update the full address
 
-                    new[self.DOMNA_PROPERTY_ID] = f"{row[self.DOMNA_PROPERTY_ID]}-{new_addr}"
+                    new[self.DOMNA_PROPERTY_ID] = (
+                        f"{row[self.DOMNA_PROPERTY_ID]}-{new_addr}"
+                    )
                     expanded_rows.append(new.to_dict())
                 continue
 
             # 2 ─ Explicit list  (e.g. 1, 2, 5 Block) or split by an ampersand (e.g. 1 & 2 Block)
             nums = NUM_RE.findall(addr)
-            if len(nums) > 1 and (',' in addr or '&' in addr or ' and ' in addr.lower()):
+            if len(nums) > 1 and (
+                "," in addr or "&" in addr or " and " in addr.lower()
+            ):
                 for n in nums:
                     new = row.copy()
-                    new_addr = re.sub(NUM_RE, n, addr, count=1)  # replace the first number only
+                    new_addr = re.sub(
+                        NUM_RE, n, addr, count=1
+                    )  # replace the first number only
                     new[self.STANDARD_ADDRESS_1] = new_addr
-                    new[self.DOMNA_PROPERTY_ID] = f"{row[self.DOMNA_PROPERTY_ID]}-{new_addr}"
+                    new[self.DOMNA_PROPERTY_ID] = (
+                        f"{row[self.DOMNA_PROPERTY_ID]}-{new_addr}"
+                    )
                     expanded_rows.append(new.to_dict())
                 continue
 
@@ -2252,7 +2832,9 @@ class AssetList:
                         new = row.copy()
                         new_addr = f"{n}{chr(letter)}"
                         new[self.STANDARD_ADDRESS_1] = new_addr
-                        new[self.DOMNA_PROPERTY_ID] = f"{row[self.DOMNA_PROPERTY_ID]}-{new_addr}"
+                        new[self.DOMNA_PROPERTY_ID] = (
+                            f"{row[self.DOMNA_PROPERTY_ID]}-{new_addr}"
+                        )
                         expanded_rows.append(new.to_dict())
                 continue
 
@@ -2272,18 +2854,19 @@ class AssetList:
 
         # We drop the blocks from the standardised asset list and append on the expanded blocks
         self.standardised_asset_list = self.standardised_asset_list[
-            self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE] != "block of flats"
-            ]
+            self.standardised_asset_list[self.STANDARD_PROPERTY_TYPE]
+            != "block of flats"
+        ]
 
         self.standardised_asset_list = pd.concat(
-            [self.standardised_asset_list, expanded_blocks],
-            ignore_index=True
+            [self.standardised_asset_list, expanded_blocks], ignore_index=True
         )
 
         # As a final clean up, for any blocks that are size 1, we don't includr a project code
         sizes = (
-            expanded_blocks
-            .groupby(self.STANDARD_BLOCK_REFERENCE)[self.DOMNA_PROPERTY_ID]
+            expanded_blocks.groupby(self.STANDARD_BLOCK_REFERENCE)[
+                self.DOMNA_PROPERTY_ID
+            ]
             .nunique()
             .reset_index()
         )
@@ -2294,7 +2877,7 @@ class AssetList:
                 size_1[self.STANDARD_BLOCK_REFERENCE].values
             ),
             None,
-            self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE]
+            self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE],
         )
 
     def label_property_status(self):
@@ -2307,10 +2890,10 @@ class AssetList:
 
         # For anything that is ready to go, that gets set to ready to be scheduled
         self.standardised_asset_list["hubspot_status"] = np.where(
-            ~pd.isnull(self.standardised_asset_list["cavity_reason"]) |
-            ~pd.isnull(self.standardised_asset_list["solar_reason"]),
+            ~pd.isnull(self.standardised_asset_list["cavity_reason"])
+            | ~pd.isnull(self.standardised_asset_list["solar_reason"]),
             hubspot_config.HubspotProcessStatus.READY_TO_BE_SCHEDULED.label,
-            None
+            None,
         )
 
         # we step through the process of flagging completed surveys
@@ -2321,43 +2904,56 @@ class AssetList:
 
         def get_max_status_from_columns(row):
             status_candidates = []
-            for col in ["submission_status", "ecosurv_install_status", "outcome_status"]:
+            for col in [
+                "submission_status",
+                "ecosurv_install_status",
+                "outcome_status",
+            ]:
                 label = row.get(col)
                 if label in label_to_enum:
                     status_candidates.append(label_to_enum[label])
             if not status_candidates:
-                return row["hubspot_status"]  # fallback to existing status if no updates
+                return row[
+                    "hubspot_status"
+                ]  # fallback to existing status if no updates
             return max(status_candidates).label
 
-        self.standardised_asset_list["hubspot_status"] = self.standardised_asset_list.apply(
-            get_max_status_from_columns, axis=1
+        self.standardised_asset_list["hubspot_status"] = (
+            self.standardised_asset_list.apply(get_max_status_from_columns, axis=1)
         )
 
         self.standardised_asset_list["project_code"] = None
         # if we have any blocks, where work is eligible, we flag them now
         # These blocks may be refecence via the landlord_block_reference field, or by property types being
         # blocks of flats
-        has_landlord_block_reference = sum(~pd.isnull(self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE]))
+        has_landlord_block_reference = sum(
+            ~pd.isnull(self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE])
+        )
 
         if has_landlord_block_reference:
             # For blocks that have a 50% allocation, we create project codes
             self.block_analysis()
             # find any block refs with more than 50% emptires
             viable_empty_blocks = self.block_analysis_df[
-                self.block_analysis_df['Percentage of Empties'] >= 0.50
-                ]
+                self.block_analysis_df["Percentage of Empties"] >= 0.50
+            ]
 
             if not viable_empty_blocks.empty:
                 project_code_lookup = viable_empty_blocks[["Block Reference"]].copy()
                 self.standardised_asset_list = self.standardised_asset_list.merge(
-                    project_code_lookup, how="left", left_on=self.STANDARD_BLOCK_REFERENCE, right_on="Block Reference"
+                    project_code_lookup,
+                    how="left",
+                    left_on=self.STANDARD_BLOCK_REFERENCE,
+                    right_on="Block Reference",
                 )
                 self.standardised_asset_list["project_code"] = np.where(
                     ~pd.isnull(self.standardised_asset_list["Block Reference"]),
                     self.standardised_asset_list["Block Reference"],
-                    self.standardised_asset_list["project_code"]
+                    self.standardised_asset_list["project_code"],
+                )
+                self.standardised_asset_list = self.standardised_asset_list.drop(
+                    columns=["Block Reference"]
                 )
-                self.standardised_asset_list = self.standardised_asset_list.drop(columns=["Block Reference"])
 
     def analyse_geographies(self):
         cavity_programme = (
@@ -2379,13 +2975,15 @@ class AssetList:
             .reset_index()
             .rename(columns={"landlord_property_id": "n_properties"})
         )
-        geographical_areas = postcodes.merge(cavity_programme, how="left", on="domna_postcode").merge(
-            solar_programme, how="left", on="domna_postcode"
-        ).fillna(0)
+        geographical_areas = (
+            postcodes.merge(cavity_programme, how="left", on="domna_postcode")
+            .merge(solar_programme, how="left", on="domna_postcode")
+            .fillna(0)
+        )
         geographical_areas["coverage"] = (
-            (
-                geographical_areas["solar_reason"] + geographical_areas["cavity_reason"]
-            ) / geographical_areas["n_properties"] * 100
+            (geographical_areas["solar_reason"] + geographical_areas["cavity_reason"])
+            / geographical_areas["n_properties"]
+            * 100
         )
 
         geographical_areas = geographical_areas.sort_values("coverage", ascending=False)
@@ -2397,34 +2995,55 @@ class AssetList:
         LABEL_TO_ENUM = {e.label: e for e in hubspot_config.HubspotProcessStatus}
 
         # Threshold status - anything that is at this stage or beyond is considered surveyed
-        threshold = hubspot_config.HubspotProcessStatus.SURVEYED_COMPLETED_SIGNED_OFF.value
+        threshold = (
+            hubspot_config.HubspotProcessStatus.SURVEYED_COMPLETED_SIGNED_OFF.value
+        )
 
         block_analysis = []
-        for block_reference, group in self.standardised_asset_list.groupby(self.STANDARD_BLOCK_REFERENCE):
+        for block_reference, group in self.standardised_asset_list.groupby(
+            self.STANDARD_BLOCK_REFERENCE
+        ):
 
-            cavity_breakdown = group["cavity_reason"].fillna("No Eligibility").value_counts(normalize=True) * 100
+            cavity_breakdown = (
+                group["cavity_reason"]
+                .fillna("No Eligibility")
+                .value_counts(normalize=True)
+                * 100
+            )
 
             if all(cavity_breakdown.index == "No Eligibility"):
                 continue
 
             # We check the % of empty vs not empty as right now, we're focused on empty
             n_empties = (
-                (group["identified_empty_cavity"] == True) &
-                (~pd.isnull(group["cavity_reason"])) &
-                (~group["cavity_reason"].str.contains("(unlikely to quality)", case=False, na=False, regex=False))
+                (group["identified_empty_cavity"] == True)
+                & (~pd.isnull(group["cavity_reason"]))
+                & (
+                    ~group["cavity_reason"].str.contains(
+                        "(unlikely to quality)", case=False, na=False, regex=False
+                    )
+                )
             ).sum()
 
             n_empties_high_confidence = (
-                (group["identified_empty_cavity"] == True) &
-                (~group["SAP Category"].isin(["SAP Rating 69-75", "SAP Rating 76 or more"])) &
-                (~pd.isnull(group["cavity_reason"])) &
-                (~group["cavity_reason"].str.contains("(unlikely to quality)", case=False, na=False, regex=False))
+                (group["identified_empty_cavity"] == True)
+                & (
+                    ~group["SAP Category"].isin(
+                        ["SAP Rating 69-75", "SAP Rating 76 or more"]
+                    )
+                )
+                & (~pd.isnull(group["cavity_reason"]))
+                & (
+                    ~group["cavity_reason"].str.contains(
+                        "(unlikely to quality)", case=False, na=False, regex=False
+                    )
+                )
             ).sum()
 
             # Average age of the EPCs
             group["time_since_epc"] = (
-                pd.to_datetime("now") - pd.to_datetime(
-                group[self.EPC_API_DATA_NAMES["inspection-date"]])
+                pd.to_datetime("now")
+                - pd.to_datetime(group[self.EPC_API_DATA_NAMES["inspection-date"]])
             ).dt.days
 
             average_age_of_epc = group["time_since_epc"].mean()
@@ -2456,21 +3075,26 @@ class AssetList:
         block_analysis["Eligible for Works"] = (
             block_analysis["Percentage of Empties"] >= 0.50
         )
-        block_analysis = block_analysis.sort_values("Percentage of Empties", ascending=False)
+        block_analysis = block_analysis.sort_values(
+            "Percentage of Empties", ascending=False
+        )
 
         # For properties that are NOT eligible, we should update the cavity reason
-        ineligible_blocks = block_analysis[
-            ~block_analysis["Eligible for Works"]
-        ]["Block Reference"].values
+        ineligible_blocks = block_analysis[~block_analysis["Eligible for Works"]][
+            "Block Reference"
+        ].values
 
-        eligible_blocks = block_analysis[
-            block_analysis["Eligible for Works"]
-        ]["Block Reference"].values
+        eligible_blocks = block_analysis[block_analysis["Eligible for Works"]][
+            "Block Reference"
+        ].values
 
         self.standardised_asset_list["cavity_reason"] = np.where(
-            self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE].isin(ineligible_blocks),
-            self.standardised_asset_list["cavity_reason"] + " (Flat in block with less than 50% eligible)",
+            self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE].isin(
+                ineligible_blocks
+            ),
             self.standardised_asset_list["cavity_reason"]
+            + " (Flat in block with less than 50% eligible)",
+            self.standardised_asset_list["cavity_reason"],
         )
 
         # if the property is in a block of flats that eligible, but the property itself is not eligible, we flag this
@@ -2478,10 +3102,13 @@ class AssetList:
         # =The property should be in a block of flats
 
         self.standardised_asset_list["cavity_reason"] = np.where(
-            self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE].isin(eligible_blocks),
-            self.standardised_asset_list["cavity_reason"]
-            + " " + "(Flat in block with more than 50% eligible)",
+            self.standardised_asset_list[self.STANDARD_BLOCK_REFERENCE].isin(
+                eligible_blocks
+            ),
             self.standardised_asset_list["cavity_reason"]
+            + " "
+            + "(Flat in block with more than 50% eligible)",
+            self.standardised_asset_list["cavity_reason"],
         )
 
         self.block_analysis_df = block_analysis
@@ -2513,7 +3140,7 @@ class AssetList:
         email_column=None,
         fullname_column=None,
         firstname_column=None,
-        lastname_column=None
+        lastname_column=None,
     ):
 
         self.contact_detail_fields = {
@@ -2524,12 +3151,16 @@ class AssetList:
             "email": email_column,
             "fullname": fullname_column,
             "firstname": firstname_column,
-            "lastname": lastname_column
+            "lastname": lastname_column,
         }
 
         details_colnames = [
-            phone_number_column, secondary_phone_number_column, email_column, fullname_column, firstname_column,
-            lastname_column
+            phone_number_column,
+            secondary_phone_number_column,
+            email_column,
+            fullname_column,
+            firstname_column,
+            lastname_column,
         ]
         # We'll fill them
         none_details = [x for x in details_colnames if x is None]
@@ -2537,23 +3168,29 @@ class AssetList:
 
         if local_filepath is None:
             # Create an empty DataFrame based on the fields in self.contact_detail_fields
-            self.contact_details = pd.DataFrame(columns=list(self.contact_detail_fields.keys()))
+            self.contact_details = pd.DataFrame(
+                columns=list(self.contact_detail_fields.keys())
+            )
             return
 
-        contact_details = pd.read_excel(
-            local_filepath, sheet_name=sheet_name
-        )[[self.contact_detail_fields["landlord_property_id"]] + details_colnames]
+        contact_details = pd.read_excel(local_filepath, sheet_name=sheet_name)[
+            [self.contact_detail_fields["landlord_property_id"]] + details_colnames
+        ]
         contact_details = contact_details[
-            ~pd.isnull(contact_details[self.contact_detail_fields["landlord_property_id"]])
+            ~pd.isnull(
+                contact_details[self.contact_detail_fields["landlord_property_id"]]
+            )
         ]
         # Fill anything we don't have
         for detail in none_details:
             contact_details[detail] = None
 
         if fullname_column and not (firstname_column and lastname_column):
-            contact_details["title"], contact_details["first_name"], contact_details["last_name"] = zip(
-                *contact_details[fullname_column].apply(self.split_full_name)
-            )
+            (
+                contact_details["title"],
+                contact_details["first_name"],
+                contact_details["last_name"],
+            ) = zip(*contact_details[fullname_column].apply(self.split_full_name))
         else:
             contact_details["title"] = None
 
@@ -2588,11 +3225,13 @@ class AssetList:
             landlord_sap=cls.STANDARD_SAP,
             landlord_block_reference=cls.STANDARD_BLOCK_REFERENCE,
             phase=False,
-            header=header
+            header=header,
         )
         return instance
 
-    def prepare_for_crm(self, company_domain, installer_name, reconcile_programme=False):
+    def prepare_for_crm(
+        self, company_domain, installer_name, reconcile_programme=False
+    ):
         """
         This function prepares the data for upload into Hubspot
         :param company_domain: The company domain name to be used in the CRM
@@ -2603,10 +3242,14 @@ class AssetList:
         """
         # This maps the opportunities as we reference them, to the product data as stored in Hubspot
         if not hubspot_config.Installer.is_valid_value(installer_name):
-            raise ValueError(f"Installer name {installer_name} is not valid. Please check the installer name.")
+            raise ValueError(
+                f"Installer name {installer_name} is not valid. Please check the installer name."
+            )
 
         # We check if all products are covered in the lookup table
-        cavity_products = self.standardised_asset_list["cavity_reason"].unique().tolist()
+        cavity_products = (
+            self.standardised_asset_list["cavity_reason"].unique().tolist()
+        )
         cavity_products = [x for x in cavity_products if not pd.isnull(x)]
         solar_products = self.standardised_asset_list["solar_reason"].unique().tolist()
         solar_products = [x for x in solar_products if not pd.isnull(x)]
@@ -2627,20 +3270,25 @@ class AssetList:
 
         programme_data = self.standardised_asset_list.copy()
         programme_data["domna_full_address"] = (
-            programme_data["domna_full_address"].str.replace(";", ", ", regex=False).str.replace("  ", "")
+            programme_data["domna_full_address"]
+            .str.replace(";", ", ", regex=False)
+            .str.replace("  ", "")
         )
 
         # Format the two date columns
-        programme_data["survey_date"] = pd.to_datetime(programme_data["survey_date"], errors="coerce")
+        programme_data["survey_date"] = pd.to_datetime(
+            programme_data["survey_date"], errors="coerce"
+        )
         programme_data[self.EPC_API_DATA_NAMES["inspection-date"]] = pd.to_datetime(
-            programme_data[self.EPC_API_DATA_NAMES["inspection-date"]],
-            errors="coerce"
+            programme_data[self.EPC_API_DATA_NAMES["inspection-date"]], errors="coerce"
         )
         # Convert to dd/mm/yyyy format
-        programme_data["survey_date"] = programme_data["survey_date"].dt.strftime("%d/%m/%Y")
-        programme_data[self.EPC_API_DATA_NAMES["inspection-date"]] = (
-            programme_data[self.EPC_API_DATA_NAMES["inspection-date"]].dt.strftime("%d/%m/%Y")
+        programme_data["survey_date"] = programme_data["survey_date"].dt.strftime(
+            "%d/%m/%Y"
         )
+        programme_data[self.EPC_API_DATA_NAMES["inspection-date"]] = programme_data[
+            self.EPC_API_DATA_NAMES["inspection-date"]
+        ].dt.strftime("%d/%m/%Y")
 
         # We take rows that have a survyor and a date for the survey
         # We include properties under 2 circumstances:
@@ -2653,12 +3301,13 @@ class AssetList:
         else:
 
             if programme_data["hubspot_status"].nunique() > 1:
-                logger.info("Multiple hubspot_status found - are you sure you don't want to reconcile the programme?")
+                logger.info(
+                    "Multiple hubspot_status found - are you sure you don't want to reconcile the programme?"
+                )
 
             ready_to_be_scheduled = (
-                (
-                    programme_data["hubspot_status"] == hubspot_config.HubspotProcessStatus.READY_TO_BE_SCHEDULED.label
-                )
+                programme_data["hubspot_status"]
+                == hubspot_config.HubspotProcessStatus.READY_TO_BE_SCHEDULED.label
             )
             # completed_works = (
             #     (programme_data["hubspot_status"] !=
@@ -2685,8 +3334,14 @@ class AssetList:
         )
 
         # We check if we have any missings
-        cavity_missing = pd.isnull(programme_data[~pd.isnull(programme_data["cavity_reason"])]["cavity_product"]).sum()
-        solar_missing = pd.isnull(programme_data[~pd.isnull(programme_data["solar_reason"])]["solar_product"]).sum()
+        cavity_missing = pd.isnull(
+            programme_data[~pd.isnull(programme_data["cavity_reason"])][
+                "cavity_product"
+            ]
+        ).sum()
+        solar_missing = pd.isnull(
+            programme_data[~pd.isnull(programme_data["solar_reason"])]["solar_product"]
+        ).sum()
 
         if cavity_missing > 0 or solar_missing > 0:
             raise ValueError(
@@ -2698,7 +3353,7 @@ class AssetList:
         programme_data["domna_product"] = np.where(
             pd.isnull(programme_data["domna_product"]),
             programme_data["cavity_product"],
-            programme_data["domna_product"]
+            programme_data["domna_product"],
         )
         # We filter just on rows where we have a product
         if reconcile_programme:
@@ -2715,33 +3370,41 @@ class AssetList:
 
             if pd.isnull(programme_data["domna_product"]).sum():
                 raise ValueError("Missing products")
-        programme_data = programme_data.drop(columns=["solar_product", "cavity_product"])
+        programme_data = programme_data.drop(
+            columns=["solar_product", "cavity_product"]
+        )
 
         product_df = (
-            pd.DataFrame(self.CRM_PRODUCTS).T[["name", "id", "unit_price"]]
+            pd.DataFrame(self.CRM_PRODUCTS)
+            .T[["name", "id", "unit_price"]]
             .reset_index()
             .rename(
                 columns={
                     "name": "Name <LINE_ITEM name>",
-                    "id": 'Product ID <LINE_ITEM hs_product_id>',
-                    "unit_price": 'Unit price <LINE_ITEM price>',
-                    "index": "domna_product"
+                    "id": "Product ID <LINE_ITEM hs_product_id>",
+                    "unit_price": "Unit price <LINE_ITEM price>",
+                    "index": "domna_product",
                 }
             )
         )
 
-        product_df['Quantity <LINE_ITEM quantity>'] = 1
+        product_df["Quantity <LINE_ITEM quantity>"] = 1
 
         # Append on the product data
-        programme_data = programme_data.merge(product_df, how="left", on="domna_product")
+        programme_data = programme_data.merge(
+            product_df, how="left", on="domna_product"
+        )
 
         # Add in deal and pipeline information
         programme_data["dealname"] = (
-            programme_data[self.STANDARD_FULL_ADDRESS] + ", " +
-            programme_data[self.STANDARD_POSTCODE] + " : " + programme_data["domna_product"]
+            programme_data[self.STANDARD_FULL_ADDRESS]
+            + ", "
+            + programme_data[self.STANDARD_POSTCODE]
+            + " : "
+            + programme_data["domna_product"]
         )
-        programme_data['Pipeline <DEAL pipeline>'] = hubspot_config.CRM_PIPELINE_NAME
-        programme_data['Associations: Listing'] = "Property Owner"
+        programme_data["Pipeline <DEAL pipeline>"] = hubspot_config.CRM_PIPELINE_NAME
+        programme_data["Associations: Listing"] = "Property Owner"
 
         # We determine which column we should use for the UPRN
         if self.STANDARD_UPRN not in programme_data.columns:
@@ -2761,20 +3424,25 @@ class AssetList:
         programme_data[uprn_column] = np.where(
             programme_data["estimated"].isin([1, True]),
             None,
-            programme_data[uprn_column]
+            programme_data[uprn_column],
         )
 
         # Add in some columns if we have them
         date_of_inspections = (
-            "Non-Intrusives: Date of Inspection" if
-            "Non-Intrusives: Date of Inspection" in programme_data.columns else None
+            "Non-Intrusives: Date of Inspection"
+            if "Non-Intrusives: Date of Inspection" in programme_data.columns
+            else None
         )
 
         # Ammend the property type and built form columns
-        programme_data["hubspot_property_type"] = programme_data[self.STANDARD_PROPERTY_TYPE].copy()
+        programme_data["hubspot_property_type"] = programme_data[
+            self.STANDARD_PROPERTY_TYPE
+        ].copy()
         # We don't already have this
         if self.STANDARD_BUILT_FORM in programme_data.columns:
-            programme_data["hubspot_built_form"] = programme_data[self.STANDARD_BUILT_FORM].copy()
+            programme_data["hubspot_built_form"] = programme_data[
+                self.STANDARD_BUILT_FORM
+            ].copy()
         else:
             programme_data["hubspot_built_form"] = None
 
@@ -2787,23 +3455,30 @@ class AssetList:
                 valid_values = ["house", "bungalow", "flat", "maisonette"]
                 epc_fill_col = "property-type"
             elif column_name == "hubspot_built_form":
-                valid_values = ["detached", "semi-detached", "mid-terrace", "end-terrace"]
+                valid_values = [
+                    "detached",
+                    "semi-detached",
+                    "mid-terrace",
+                    "end-terrace",
+                ]
                 epc_fill_col = "built-form"
             else:
-                raise ValueError(f"Invalid column name: {column_name}. Must be 'hubspot_property_type' or "
-                                 f"'hubspot_built_form'.")
+                raise ValueError(
+                    f"Invalid column name: {column_name}. Must be 'hubspot_property_type' or "
+                    f"'hubspot_built_form'."
+                )
 
             # Any vakue that is not house, bungalow, flat or maisonette is set to None
             programme_data[column_name] = np.where(
                 ~programme_data[column_name].isin(valid_values),
                 None,
-                programme_data[column_name]
+                programme_data[column_name],
             )
             # We fill with the EPC property type
             programme_data[column_name] = np.where(
                 pd.isnull(programme_data[column_name]),
                 programme_data[self.EPC_API_DATA_NAMES[epc_fill_col]],
-                programme_data[column_name]
+                programme_data[column_name],
             )
 
             programme_data[column_name] = programme_data[column_name].fillna("unknown")
@@ -2811,8 +3486,12 @@ class AssetList:
             return programme_data
 
         # Clean up the property type and built form columns
-        programme_data = _replace_property_description_data(programme_data, "hubspot_property_type")
-        programme_data = _replace_property_description_data(programme_data, "hubspot_built_form")
+        programme_data = _replace_property_description_data(
+            programme_data, "hubspot_property_type"
+        )
+        programme_data = _replace_property_description_data(
+            programme_data, "hubspot_built_form"
+        )
 
         # We accomodate the old vs new inspections format
         if "non-intrusives: WFT Findings" in programme_data.columns:
@@ -2826,97 +3505,133 @@ class AssetList:
             non_intrusives_roof_orientation = None
             non_intrusives_surveyor_name = None
         else:
-            non_intrusives_surveyor_notes = 'non-intrusives: Any further surveyor notes'
+            non_intrusives_surveyor_notes = "non-intrusives: Any further surveyor notes"
             non_intrusives_construction = "non-intrusives: Construction"
             non_intrusives_insulated = "non-intrusives: Insulated"
             non_intrusives_insulation_material = "non-intrusives: Material"
-            non_intrusives_ciga_check_required = 'non-intrusives: CIGA Check Required'
-            non_intrusives_pv_access = 'non-intrusives: PV, ACCESS ISSUE, SEE NOTES'
-            non_intrusives_roof_orientation = 'non-intrusives: OFF GAS - ROOF ORIENTATION'
-            non_intrusives_surveyor_name = 'non-intrusives: Surveyors Name'
+            non_intrusives_ciga_check_required = "non-intrusives: CIGA Check Required"
+            non_intrusives_pv_access = "non-intrusives: PV, ACCESS ISSUE, SEE NOTES"
+            non_intrusives_roof_orientation = (
+                "non-intrusives: OFF GAS - ROOF ORIENTATION"
+            )
+            non_intrusives_surveyor_name = "non-intrusives: Surveyors Name"
 
         # This maps the hubspot schema to the template. Anything that is not covered in this will be flagged
         schema_mappings = {
-            'Company Domain Name <COMPANY domain>': 'Company Domain Name <COMPANY domain>',
-            'Email <CONTACT email>': (
-                self.contact_detail_fields["email"] if self.contact_detail_fields["email"] else None
+            "Company Domain Name <COMPANY domain>": "Company Domain Name <COMPANY domain>",
+            "Email <CONTACT email>": (
+                self.contact_detail_fields["email"]
+                if self.contact_detail_fields["email"]
+                else None
             ),  # TODO: Review
-            'First Name <CONTACT firstname>': (
-                self.contact_detail_fields["firstname"] if self.contact_detail_fields["firstname"] else None
+            "First Name <CONTACT firstname>": (
+                self.contact_detail_fields["firstname"]
+                if self.contact_detail_fields["firstname"]
+                else None
             ),  # TODO: Review
-            'Last Name <CONTACT lastname>': (
-                self.contact_detail_fields["lastname"] if self.contact_detail_fields["lastname"] else None
+            "Last Name <CONTACT lastname>": (
+                self.contact_detail_fields["lastname"]
+                if self.contact_detail_fields["lastname"]
+                else None
             ),  # TODO: Review
-            'Phone <CONTACT phone>': (
-                self.contact_detail_fields["phone_number"] if self.contact_detail_fields["phone_number"] else None
+            "Phone <CONTACT phone>": (
+                self.contact_detail_fields["phone_number"]
+                if self.contact_detail_fields["phone_number"]
+                else None
             ),  # TODO: Review
-            'Secondary Phone <CONTACT secondary_phone_number>': (
-                self.contact_detail_fields["secondary_phone_number"] if
-                self.contact_detail_fields["secondary_phone_number"] else None
+            "Secondary Phone <CONTACT secondary_phone_number>": (
+                self.contact_detail_fields["secondary_phone_number"]
+                if self.contact_detail_fields["secondary_phone_number"]
+                else None
             ),
             "Secondary Contact Full Name <CONTACT secondary_contact_full_name>": (
-                self.contact_detail_fields["secondary_contact_full_name"] if
-                self.contact_detail_fields["secondary_contact_full_name"] else None
+                self.contact_detail_fields["secondary_contact_full_name"]
+                if self.contact_detail_fields["secondary_contact_full_name"]
+                else None
             ),
-            'Full Address <LISTING full_address>': self.STANDARD_FULL_ADDRESS,
-            'Address 1 <LISTING hs_address_1>': self.STANDARD_ADDRESS_1,
-            'Address 2 <LISTING hs_address_2>': None,  # TODO: Don't have this for the moment
-            'Postcode <LISTING hs_zip>': self.STANDARD_POSTCODE,
-            'Property Type <LISTING property_type>': "hubspot_property_type",
-            'Property Sub Type <LISTING property_sub_type>': "hubspot_built_form",
-            'Bedroom(s) <LISTING hs_bedrooms>': None,  # TODO: Don't have this for the moment
-            'Domna Property ID <LISTING domna_property_id>': self.DOMNA_PROPERTY_ID,
+            "Full Address <LISTING full_address>": self.STANDARD_FULL_ADDRESS,
+            "Address 1 <LISTING hs_address_1>": self.STANDARD_ADDRESS_1,
+            "Address 2 <LISTING hs_address_2>": None,  # TODO: Don't have this for the moment
+            "Postcode <LISTING hs_zip>": self.STANDARD_POSTCODE,
+            "Property Type <LISTING property_type>": "hubspot_property_type",
+            "Property Sub Type <LISTING property_sub_type>": "hubspot_built_form",
+            "Bedroom(s) <LISTING hs_bedrooms>": None,  # TODO: Don't have this for the moment
+            "Domna Property ID <LISTING domna_property_id>": self.DOMNA_PROPERTY_ID,
             # We populate this with the column that we have
-            'National UPRN <LISTING national_uprn>': uprn_column,
-            'Owner Property ID <LISTING owner_property_id>': self.STANDARD_LANDLORD_PROPERTY_ID,
-            'Wall Construction <LISTING wall_construction>': self.STANDARD_WALL_CONSTRUCTION,
-            'Heating System <LISTING heating_system>': self.STANDARD_HEATING_SYSTEM,
-            'Year Built <LISTING hs_year_built>': self.STANDARD_YEAR_BUILT,
-            'Boiler Make <LISTING boiler_make>': None,  # TODO: Don't have this for the moment
-            'Boiler Model <LISTING boiler_model>': None,  # TODO: Don't have this for the moment
-            'Non-Intrusives: Date Checked <LISTING non_intrusives__date_checked>': date_of_inspections,
-            'Non-Intrusives: Wall Type <LISTING non_intrusives__wall_type>': non_intrusives_construction,
-            'Non-intrusives: Insulation <LISTING non_intrusives__insulation>': non_intrusives_insulated,
-            'Non-intrusives: Insulation Material <LISTING non_intrusives__insulation_material>':
-                non_intrusives_insulation_material,
-            'Non-Intrusives: CIGA Check Required <LISTING non_intrusives__ciga_check_required>':
-                non_intrusives_ciga_check_required,
-            'Non-Intrusives: PV Access Issues <LISTING non_intrusives__access_issues>': non_intrusives_pv_access,
-            'Non-Intrusives: Roof Orientation <LISTING non_intrusives__roof_orientation>':
-                non_intrusives_roof_orientation,
-            'Non-Intrusives: Surveyor Notes <LISTING non_intrusives__surveyor_notes>': non_intrusives_surveyor_notes,
-            'Non-Intrusives: Surveyor Name <LISTING non_intrusives__surveyor_name>': non_intrusives_surveyor_name,
-            'CIGA: Date Requested <LISTING ciga__date_requested>': None,  # TODO: Don't have this for the moment
-            'CIGA: Cavity Guarantee Found <LISTING ciga__cavity_guarantee_found>': None,
-            'Last EPC: Is Estimated <LISTING last_epc__is_estimated>': self.EPC_API_DATA_NAMES["estimated"],
-            'Last EPC: EPC Rating <LISTING last_epc__epc_rating>': self.EPC_API_DATA_NAMES["current-energy-rating"],
-            'Last EPC: SAP Rating <LISTING last_epc__sap_rating>': self.EPC_API_DATA_NAMES["current-energy-efficiency"],
-            'Last EPC: Main Heating Description <LISTING last_epc__main_heating_description>': self.EPC_API_DATA_NAMES[
-                "mainheat-description"],
-            'Last EPC: Heating Controls <LISTING last_epc__heating_controls>': self.EPC_API_DATA_NAMES[
-                "mainheatcont-description"],
-            'Last EPC: Lodgement Date <LISTING last_epc__lodgement_date>': self.EPC_API_DATA_NAMES["inspection-date"],
-            'Last EPC: Floor Area <LISTING last_epc__floor_area>': self.EPC_API_DATA_NAMES["total-floor-area"],
-            'Last EPC: Wall <LISTING last_epc__wall>': self.EPC_API_DATA_NAMES["walls-description"],
-            'Last EPC: Roof <LISTING last_epc__roof>': self.EPC_API_DATA_NAMES["roof-description"],
-            'Last EPC: Floor <LISTING last_epc__floor>': self.EPC_API_DATA_NAMES["floor-description"],
-            'Last EPC: Room Height <LISTING last_epc__room_height>': self.EPC_API_DATA_NAMES["floor-height"],
-            'Last EPC: Age Band <LISTING last_epc__age_band>': self.EPC_API_DATA_NAMES["construction-age-band"],
-            'Pipeline <DEAL pipeline>': 'Pipeline <DEAL pipeline>',
-            'Expected Commencement Date <DEAL expected_commencement_date>': "survey_date",
-            'Deal Name <DEAL dealname>': "dealname",  # Need to create this,
-            'Product ID <LINE_ITEM hs_product_id>': 'Product ID <LINE_ITEM hs_product_id>',
-            'Name <LINE_ITEM name>': 'Name <LINE_ITEM name>',
-            'Unit price <LINE_ITEM price>': 'Unit price <LINE_ITEM price>',
-            'Quantity <LINE_ITEM quantity>': 'Quantity <LINE_ITEM quantity>',
-            'Deal Owner': 'surveyor',
-            'Project Code <DEAL project_code>': 'project_code',
-            'Associations: Listing': 'Associations: Listing',
-            'Deal Stage <DEAL dealstage>': "hubspot_status",
+            "National UPRN <LISTING national_uprn>": uprn_column,
+            "Owner Property ID <LISTING owner_property_id>": self.STANDARD_LANDLORD_PROPERTY_ID,
+            "Wall Construction <LISTING wall_construction>": self.STANDARD_WALL_CONSTRUCTION,
+            "Heating System <LISTING heating_system>": self.STANDARD_HEATING_SYSTEM,
+            "Year Built <LISTING hs_year_built>": self.STANDARD_YEAR_BUILT,
+            "Boiler Make <LISTING boiler_make>": None,  # TODO: Don't have this for the moment
+            "Boiler Model <LISTING boiler_model>": None,  # TODO: Don't have this for the moment
+            "Non-Intrusives: Date Checked <LISTING non_intrusives__date_checked>": date_of_inspections,
+            "Non-Intrusives: Wall Type <LISTING non_intrusives__wall_type>": non_intrusives_construction,
+            "Non-intrusives: Insulation <LISTING non_intrusives__insulation>": non_intrusives_insulated,
+            "Non-intrusives: Insulation Material <LISTING non_intrusives__insulation_material>": non_intrusives_insulation_material,
+            "Non-Intrusives: CIGA Check Required <LISTING non_intrusives__ciga_check_required>": non_intrusives_ciga_check_required,
+            "Non-Intrusives: PV Access Issues <LISTING non_intrusives__access_issues>": non_intrusives_pv_access,
+            "Non-Intrusives: Roof Orientation <LISTING non_intrusives__roof_orientation>": non_intrusives_roof_orientation,
+            "Non-Intrusives: Surveyor Notes <LISTING non_intrusives__surveyor_notes>": non_intrusives_surveyor_notes,
+            "Non-Intrusives: Surveyor Name <LISTING non_intrusives__surveyor_name>": non_intrusives_surveyor_name,
+            "CIGA: Date Requested <LISTING ciga__date_requested>": None,  # TODO: Don't have this for the moment
+            "CIGA: Cavity Guarantee Found <LISTING ciga__cavity_guarantee_found>": None,
+            "Last EPC: Is Estimated <LISTING last_epc__is_estimated>": self.EPC_API_DATA_NAMES[
+                "estimated"
+            ],
+            "Last EPC: EPC Rating <LISTING last_epc__epc_rating>": self.EPC_API_DATA_NAMES[
+                "current-energy-rating"
+            ],
+            "Last EPC: SAP Rating <LISTING last_epc__sap_rating>": self.EPC_API_DATA_NAMES[
+                "current-energy-efficiency"
+            ],
+            "Last EPC: Main Heating Description <LISTING last_epc__main_heating_description>": self.EPC_API_DATA_NAMES[
+                "mainheat-description"
+            ],
+            "Last EPC: Heating Controls <LISTING last_epc__heating_controls>": self.EPC_API_DATA_NAMES[
+                "mainheatcont-description"
+            ],
+            "Last EPC: Lodgement Date <LISTING last_epc__lodgement_date>": self.EPC_API_DATA_NAMES[
+                "inspection-date"
+            ],
+            "Last EPC: Floor Area <LISTING last_epc__floor_area>": self.EPC_API_DATA_NAMES[
+                "total-floor-area"
+            ],
+            "Last EPC: Wall <LISTING last_epc__wall>": self.EPC_API_DATA_NAMES[
+                "walls-description"
+            ],
+            "Last EPC: Roof <LISTING last_epc__roof>": self.EPC_API_DATA_NAMES[
+                "roof-description"
+            ],
+            "Last EPC: Floor <LISTING last_epc__floor>": self.EPC_API_DATA_NAMES[
+                "floor-description"
+            ],
+            "Last EPC: Room Height <LISTING last_epc__room_height>": self.EPC_API_DATA_NAMES[
+                "floor-height"
+            ],
+            "Last EPC: Age Band <LISTING last_epc__age_band>": self.EPC_API_DATA_NAMES[
+                "construction-age-band"
+            ],
+            "Pipeline <DEAL pipeline>": "Pipeline <DEAL pipeline>",
+            "Expected Commencement Date <DEAL expected_commencement_date>": "survey_date",
+            "Deal Name <DEAL dealname>": "dealname",  # Need to create this,
+            "Product ID <LINE_ITEM hs_product_id>": "Product ID <LINE_ITEM hs_product_id>",
+            "Name <LINE_ITEM name>": "Name <LINE_ITEM name>",
+            "Unit price <LINE_ITEM price>": "Unit price <LINE_ITEM price>",
+            "Quantity <LINE_ITEM quantity>": "Quantity <LINE_ITEM quantity>",
+            "Deal Owner": "surveyor",
+            "Project Code <DEAL project_code>": "project_code",
+            "Associations: Listing": "Associations: Listing",
+            "Deal Stage <DEAL dealstage>": "hubspot_status",
         }
 
         # We sometimes columns if the landlord never provided them
-        missed_mapping_cols = [c for c in schema_mappings.values() if c not in programme_data.columns if c is not None]
+        missed_mapping_cols = [
+            c
+            for c in schema_mappings.values()
+            if c not in programme_data.columns
+            if c is not None
+        ]
         for c in missed_mapping_cols:
             programme_data[c] = None
 
@@ -2934,22 +3649,32 @@ class AssetList:
             columns={v: k for k, v in schema_mappings.items() if v is not None}
         )
 
-        programme_data['Postcode <DEAL postcode>'] = programme_data['Postcode <LISTING hs_zip>'].copy()
-        programme_data['Installer <DEAL installer>'] = installer_name
-        programme_data['Name <LISTING hs_name>'] = (
-            programme_data['Full Address <LISTING full_address>'] + " ," + programme_data['Postcode <LISTING hs_zip>']
+        programme_data["Postcode <DEAL postcode>"] = programme_data[
+            "Postcode <LISTING hs_zip>"
+        ].copy()
+        programme_data["Installer <DEAL installer>"] = installer_name
+        programme_data["Name <LISTING hs_name>"] = (
+            programme_data["Full Address <LISTING full_address>"]
+            + " ,"
+            + programme_data["Postcode <LISTING hs_zip>"]
         )
         # The listing owner email is the same as the surveyor email (deal owner), so they can see the listing
-        programme_data['Listing Owner Email <LISTING hubspot_owner_id>'] = programme_data['Deal Owner']
-        programme_data['Amount <DEAL amount>'] = 0
+        programme_data["Listing Owner Email <LISTING hubspot_owner_id>"] = (
+            programme_data["Deal Owner"]
+        )
+        programme_data["Amount <DEAL amount>"] = 0
         programme_data["Deal Owner"] = np.where(
             ~pd.isnull(programme_data["Deal Owner"]),
             programme_data["Deal Owner"].astype(str).str.lower(),
-            programme_data["Deal Owner"]
+            programme_data["Deal Owner"],
         )
 
         # We make sure we have all of the columns that we need
-        missed_columns = [c for c in hubspot_config.CRM_UPLOAD_COLUMNS if c not in programme_data.columns]
+        missed_columns = [
+            c
+            for c in hubspot_config.CRM_UPLOAD_COLUMNS
+            if c not in programme_data.columns
+        ]
         if missed_columns:
             raise ValueError(
                 f"We have the following columns that are not in the programme data: {missed_columns}. "
@@ -2959,7 +3684,6 @@ class AssetList:
         self.hubspot_data = programme_data
 
     def flag_ecosurv(self, ecosurv_landlords=None, landlords_to_ignore=None):
-
         """
         This class will match ecosurv data to the asset list
         :return:
@@ -2968,7 +3692,9 @@ class AssetList:
             return
 
         # TODO: Fetch from Sharepoint
-        ecosurv_filepath = "/Users/khalimconn-kowlessar/Documents/hestia/Ecosurv/07.05.2025.csv"
+        ecosurv_filepath = (
+            "/Users/khalimconn-kowlessar/Documents/hestia/Ecosurv/07.05.2025.csv"
+        )
         logger.info("Getting Ecosurv data from %s", ecosurv_filepath)
         self.ecosurv = pd.read_csv(ecosurv_filepath, encoding="cp437")
 
@@ -2989,12 +3715,16 @@ class AssetList:
         # Try and match to asset list
         matched = []
         unmatched = []
-        for _, row in tqdm(landlord_ecosurv_data.iterrows(), total=landlord_ecosurv_data.shape[0]):
+        for _, row in tqdm(
+            landlord_ecosurv_data.iterrows(), total=landlord_ecosurv_data.shape[0]
+        ):
             postcode = row["Postcode"].lower()
             df = self.standardised_asset_list[
                 (
-                    self.standardised_asset_list[self.STANDARD_POSTCODE].str.replace(" ", "").str.lower() ==
-                    postcode
+                    self.standardised_asset_list[self.STANDARD_POSTCODE]
+                    .str.replace(" ", "")
+                    .str.lower()
+                    == postcode
                 )
             ].copy()
 
@@ -3003,25 +3733,28 @@ class AssetList:
                 continue
 
             if df.shape[0] > 1:
-                house_no = SearchEpc.get_house_number(row["Address Line 1"], row["Postcode"])
+                house_no = SearchEpc.get_house_number(
+                    row["Address Line 1"], row["Postcode"]
+                )
                 df["house_no"] = df.apply(
                     lambda x: SearchEpc.get_house_number(
                         str(x[self.STANDARD_ADDRESS_1]), x[self.STANDARD_POSTCODE]
                     ),
-                    axis=1
+                    axis=1,
                 )
                 df = df[df["house_no"] == house_no]
 
             if df.shape[0] > 1:
                 # We compare address line 1 to full address
                 if any(
-                    df[self.STANDARD_FULL_ADDRESS].str.lower().str.contains(
-                        row["Address Line 1"].lower(), na=False)
+                    df[self.STANDARD_FULL_ADDRESS]
+                    .str.lower()
+                    .str.contains(row["Address Line 1"].lower(), na=False)
                 ):
                     df = df[
-                        df[self.STANDARD_FULL_ADDRESS].str.lower().str.contains(
-                            row["Address Line 1"].lower(), na=False
-                        )
+                        df[self.STANDARD_FULL_ADDRESS]
+                        .str.lower()
+                        .str.contains(row["Address Line 1"].lower(), na=False)
                     ]
 
             if df.shape[0] > 1:
@@ -3030,7 +3763,9 @@ class AssetList:
             if df.shape[0] == 1:
                 matched.append(
                     {
-                        self.STANDARD_LANDLORD_PROPERTY_ID: df[self.STANDARD_LANDLORD_PROPERTY_ID].values[0],
+                        self.STANDARD_LANDLORD_PROPERTY_ID: df[
+                            self.STANDARD_LANDLORD_PROPERTY_ID
+                        ].values[0],
                         "ecosurv_reference": row["Reference"],
                         "ecosurv_address1": row["Address Line 1"],
                         "ecosurv_postcode": row["Postcode"],
@@ -3053,7 +3788,9 @@ class AssetList:
         # We'll possibly have duplicates here, where properties have been sold twice. Ww de-dupe
         if matched[self.STANDARD_LANDLORD_PROPERTY_ID].duplicated().sum():
             # It doesn't matter too much which record we take
-            matched = matched.drop_duplicates(subset=[self.STANDARD_LANDLORD_PROPERTY_ID])
+            matched = matched.drop_duplicates(
+                subset=[self.STANDARD_LANDLORD_PROPERTY_ID]
+            )
 
         # We merge on the status of the property
         matched = matched.merge(
@@ -3063,12 +3800,16 @@ class AssetList:
                     "Status": "ecosurv_status",
                     "Lead Status": "ecosurv_lead_status",
                     "Tags": "ecosurv_tags",
-                    "Installer": "ecosurv_installer"
+                    "Installer": "ecosurv_installer",
                 }
-            ), how="left", on="ecosurv_reference"
+            ),
+            how="left",
+            on="ecosurv_reference",
         )
 
-        matched["ecosurv_install_status"] = hubspot_config.HubspotProcessStatus.SUBMITTED_TO_INSTALLER
+        matched["ecosurv_install_status"] = (
+            hubspot_config.HubspotProcessStatus.SUBMITTED_TO_INSTALLER
+        )
 
         # This mapping is ordered by process order, where lodgment is the final step so if we have an indication
         # that the property is ready for lodgement, we set the status to that. We then proceed through the other
@@ -3086,7 +3827,7 @@ class AssetList:
             "Retrofit: Signed off for install": hubspot_config.HubspotProcessStatus.SUBMITTED_TO_INSTALLER,
             "Audit": hubspot_config.HubspotProcessStatus.SUBMITTED_TO_INSTALLER,
             "Accepted": hubspot_config.HubspotProcessStatus.SUBMITTED_TO_INSTALLER,
-            "Sold": hubspot_config.HubspotProcessStatus.SUBMITTED_TO_INSTALLER
+            "Sold": hubspot_config.HubspotProcessStatus.SUBMITTED_TO_INSTALLER,
         }
 
         def get_max_status(tag_str):
@@ -3100,7 +3841,9 @@ class AssetList:
                 return None
             return max(matched_statuses).label
 
-        matched["ecosurv_install_status"] = matched["ecosurv_tags"].apply(get_max_status)
+        matched["ecosurv_install_status"] = matched["ecosurv_tags"].apply(
+            get_max_status
+        )
 
         self.standardised_asset_list = self.standardised_asset_list.merge(
             matched,
@@ -3120,7 +3863,7 @@ class AssetList:
         outcomes_address,
         outcomes_postcode,
         outcomes_houseno,
-        outcomes_id
+        outcomes_id,
     ):
         if not outcomes_filepaths:
             return
@@ -3129,7 +3872,9 @@ class AssetList:
         outcomes_no_match = []
         lookup = []
         for idx, outcomes_filepath in enumerate(outcomes_filepaths):
-            outcomes = pd.read_excel(outcomes_filepath, sheet_name=outcomes_sheetname[idx])
+            outcomes = pd.read_excel(
+                outcomes_filepath, sheet_name=outcomes_sheetname[idx]
+            )
             outcomes["row_id"] = outcomes.index
 
             if outcomes_houseno[idx] is None:
@@ -3139,15 +3884,21 @@ class AssetList:
                 )
 
             # We handle an edge case that occured for LHP
-            if "Notes / Outcomes" in outcomes.columns and "Outcome" not in outcomes.columns:
+            if (
+                "Notes / Outcomes" in outcomes.columns
+                and "Outcome" not in outcomes.columns
+            ):
                 # We use the re-mapper to handle this:
                 outcomes["Notes / Outcomes"] = outcomes["Notes / Outcomes"].str.strip()
                 values_to_remap = outcomes["Notes / Outcomes"].unique()
                 # We want to map this to our standardised list of property types we're interested in
                 remapper = DataRemapper(
-                    standard_values=outcomes_mappings.outcomes_values, standard_map=outcomes_mappings.outcomes_map
+                    standard_values=outcomes_mappings.outcomes_values,
+                    standard_map=outcomes_mappings.outcomes_map,
+                )
+                remap_dictionary = remapper.standardize_list(
+                    values_to_remap=values_to_remap.tolist()
                 )
-                remap_dictionary = remapper.standardize_list(values_to_remap=values_to_remap.tolist())
                 # Perform the remap
                 outcomes["Outcome"] = outcomes["Notes / Outcomes"].map(remap_dictionary)
 
@@ -3167,80 +3918,109 @@ class AssetList:
 
                 if oid is not None:
                     matched = self.standardised_asset_list[
-                        (self.standardised_asset_list[
-                             self.STANDARD_LANDLORD_PROPERTY_ID
-                         ].str.strip() == oid)
+                        (
+                            self.standardised_asset_list[
+                                self.STANDARD_LANDLORD_PROPERTY_ID
+                            ].str.strip()
+                            == oid
+                        )
                     ]
 
                     if matched.shape[0] == 1:
                         lookup_i.append(
                             {
                                 "row_id": x["row_id"],
-                                self.DOMNA_PROPERTY_ID: matched[self.DOMNA_PROPERTY_ID].values[0]
+                                self.DOMNA_PROPERTY_ID: matched[
+                                    self.DOMNA_PROPERTY_ID
+                                ].values[0],
                             }
                         )
                         continue
 
-                address_clean = x[outcomes_address[idx]].lower().replace(",", "").replace("  ", " ")
+                address_clean = (
+                    x[outcomes_address[idx]].lower().replace(",", "").replace("  ", " ")
+                )
 
                 matched = self.standardised_asset_list[
-                    (self.standardised_asset_list[
-                         self.STANDARD_FULL_ADDRESS
-                     ].str.lower().str.replace(",", "").str.replace("  ", " ") == address_clean)
+                    (
+                        self.standardised_asset_list[self.STANDARD_FULL_ADDRESS]
+                        .str.lower()
+                        .str.replace(",", "")
+                        .str.replace("  ", " ")
+                        == address_clean
+                    )
                 ]
 
                 if matched.shape[0] == 1:
                     lookup_i.append(
                         {
                             "row_id": x["row_id"],
-                            self.DOMNA_PROPERTY_ID: matched[self.DOMNA_PROPERTY_ID].values[0]
+                            self.DOMNA_PROPERTY_ID: matched[
+                                self.DOMNA_PROPERTY_ID
+                            ].values[0],
                         }
                     )
                     continue
 
                 matched = self.standardised_asset_list[
-                    (self.standardised_asset_list[self.STANDARD_POSTCODE].str.strip() == x[outcomes_postcode[idx]])
+                    (
+                        self.standardised_asset_list[self.STANDARD_POSTCODE].str.strip()
+                        == x[outcomes_postcode[idx]]
+                    )
                 ].copy()
                 if not matched.empty:
                     matched["houseno"] = matched.apply(
                         lambda x: SearchEpc.get_house_number(
-                            str(x[self.STANDARD_ADDRESS_1]), str(x[self.STANDARD_POSTCODE])
+                            str(x[self.STANDARD_ADDRESS_1]),
+                            str(x[self.STANDARD_POSTCODE]),
                         ),
-                        axis=1
+                        axis=1,
                     )
 
                     if pd.isnull(x[outcomes_houseno[idx]]):
                         house_no_to_match = SearchEpc.get_house_number(
-                            str(x[outcomes_address[idx]]), str(x[outcomes_postcode[idx]])
+                            str(x[outcomes_address[idx]]),
+                            str(x[outcomes_postcode[idx]]),
                         )
                         if isinstance(house_no_to_match, str):
                             house_no_to_match = house_no_to_match.lower()
                     else:
                         house_no_to_match = str(x[outcomes_houseno[idx]]).strip()
 
-                    matched = matched[matched["houseno"].astype(str) == house_no_to_match]
+                    matched = matched[
+                        matched["houseno"].astype(str) == house_no_to_match
+                    ]
                     if matched.shape[0] == 1:
                         lookup_i.append(
                             {
                                 "row_id": x["row_id"],
-                                self.DOMNA_PROPERTY_ID: matched[self.DOMNA_PROPERTY_ID].values[0]
+                                self.DOMNA_PROPERTY_ID: matched[
+                                    self.DOMNA_PROPERTY_ID
+                                ].values[0],
                             }
                         )
                         continue
                     elif not matched.empty:
                         # Use levenstein distance to match
                         matched["address"] = (
-                            matched[self.STANDARD_ADDRESS_1] + " " + matched[self.STANDARD_POSTCODE]
+                            matched[self.STANDARD_ADDRESS_1]
+                            + " "
+                            + matched[self.STANDARD_POSTCODE]
                         )
 
                         best_match = process.extractOne(
-                            x[outcomes_address[idx]], matched[self.STANDARD_FULL_ADDRESS].values
+                            x[outcomes_address[idx]],
+                            matched[self.STANDARD_FULL_ADDRESS].values,
                         )[0]
-                        matched = matched[matched[self.STANDARD_FULL_ADDRESS] == best_match]
+                        matched = matched[
+                            matched[self.STANDARD_FULL_ADDRESS] == best_match
+                        ]
                         lookup_i.append(
                             {
                                 "row_id": x["row_id"],
-                                self.DOMNA_PROPERTY_ID: matched[self.DOMNA_PROPERTY_ID].values[0]
+                                self.DOMNA_PROPERTY_ID: matched[
+                                    self.DOMNA_PROPERTY_ID
+                                ].values[0],
                             }
                         )
                         continue
@@ -3290,7 +4070,9 @@ class AssetList:
             raise NotImplementedError("Invalid notes in outcomes - implement me")
 
         lookup = lookup.merge(
-            self.outcomes[["row_id", "Outcome", notes_col, date_col]], how="left", on="row_id"
+            self.outcomes[["row_id", "Outcome", notes_col, date_col]],
+            how="left",
+            on="row_id",
         )
 
         visit_counts = (
@@ -3305,28 +4087,35 @@ class AssetList:
             if isinstance(s, str):
                 match = re.search(r"(\d{2}\.\d{2}\.\d{4})", s)
                 if match:
-                    return pd.to_datetime(match.group(1), format="%d.%m.%Y", errors="coerce")
+                    return pd.to_datetime(
+                        match.group(1), format="%d.%m.%Y", errors="coerce"
+                    )
             return pd.NaT
 
-        lookup['parsed_date'] = lookup[date_col].apply(extract_date)
+        lookup["parsed_date"] = lookup[date_col].apply(extract_date)
 
         def get_latest_note(group):
-            surveyed = group[group['Outcome'] == 'surveyed']
+            surveyed = group[group["Outcome"] == "surveyed"]
             if not surveyed.empty:
-                return surveyed.sort_values('parsed_date', ascending=False).iloc[0]
+                return surveyed.sort_values("parsed_date", ascending=False).iloc[0]
             else:
-                return group.sort_values('parsed_date', ascending=False).iloc[0]
+                return group.sort_values("parsed_date", ascending=False).iloc[0]
 
         latest_note = (
-            lookup.groupby('domna_property_id', group_keys=False).
-            apply(get_latest_note).
-            reset_index(drop=True)
+            lookup.groupby("domna_property_id", group_keys=False)
+            .apply(get_latest_note)
+            .reset_index(drop=True)
         )
         latest_note = latest_note[["domna_property_id", notes_col, "Outcome"]].rename(
             columns={"Notes": "latest_outcome_note", "Outcome": "latest_outcome"}
         )
 
-        pivot_df = lookup.groupby(["domna_property_id", "Outcome"]).size().unstack(fill_value=0).reset_index()
+        pivot_df = (
+            lookup.groupby(["domna_property_id", "Outcome"])
+            .size()
+            .unstack(fill_value=0)
+            .reset_index()
+        )
         pivot_df = pivot_df.merge(visit_counts, how="left", on="domna_property_id")
         pivot_df = pivot_df.merge(latest_note, how="left", on="domna_property_id")
 
@@ -3336,34 +4125,46 @@ class AssetList:
             raise Exception("We have duplicated property IDs in the outcomes data")
 
         # We merge this data onto outcomes
-        self.outcomes["matched_to_asset_list"] = self.outcomes["row_id"].isin(lookup["row_id"].values)
-        self.outcomes = self.outcomes.merge(lookup[["row_id", "domna_property_id"]], how="left", on="row_id")
+        self.outcomes["matched_to_asset_list"] = self.outcomes["row_id"].isin(
+            lookup["row_id"].values
+        )
+        self.outcomes = self.outcomes.merge(
+            lookup[["row_id", "domna_property_id"]], how="left", on="row_id"
+        )
 
         # We flag the outcome status, based on the outcome
         pivot_df["outcome_status"] = None
 
         if "surveyed" in pivot_df.columns:
             pivot_df["outcome_status"] = np.where(
-                pivot_df["surveyed"] > 0, hubspot_config.HubspotProcessStatus.SURVEYED_COMPLETED_SIGNED_OFF.label,
-                pivot_df["outcome_status"]
+                pivot_df["surveyed"] > 0,
+                hubspot_config.HubspotProcessStatus.SURVEYED_COMPLETED_SIGNED_OFF.label,
+                pivot_df["outcome_status"],
             )
 
         if "installer refusal" in pivot_df.columns:
             pivot_df["outcome_status"] = np.where(
-                pivot_df["installer refusal"] > 0, hubspot_config.HubspotProcessStatus.NOT_VIABLE.label,
-                pivot_df["outcome_status"]
+                pivot_df["installer refusal"] > 0,
+                hubspot_config.HubspotProcessStatus.NOT_VIABLE.label,
+                pivot_df["outcome_status"],
             )
 
         pivot_df["outcome_status"] = np.where(
-            pivot_df["latest_outcome"].isin(["see notes"]) &
-            (pivot_df["outcome_status"] != hubspot_config.HubspotProcessStatus.SURVEYED_COMPLETED_SIGNED_OFF.label),
+            pivot_df["latest_outcome"].isin(["see notes"])
+            & (
+                pivot_df["outcome_status"]
+                != hubspot_config.HubspotProcessStatus.SURVEYED_COMPLETED_SIGNED_OFF.label
+            ),
             hubspot_config.HubspotProcessStatus.SURVEYED_NO_ACCESS_NEEDS_SIGN_OFF.label,
-            pivot_df["outcome_status"]
+            pivot_df["outcome_status"],
         )
 
         # We merge out pivoted outcomes onto the asset list
         self.standardised_asset_list = self.standardised_asset_list.merge(
-            pivot_df, how="left", left_on=self.DOMNA_PROPERTY_ID, right_on="domna_property_id"
+            pivot_df,
+            how="left",
+            left_on=self.DOMNA_PROPERTY_ID,
+            right_on="domna_property_id",
         )
 
         if self.standardised_asset_list[self.DOMNA_PROPERTY_ID].duplicated().sum():
@@ -3372,10 +4173,7 @@ class AssetList:
         self.outcomes = self.outcomes.sort_values("domna_property_id", ascending=False)
 
     def flag_survey_master(
-        self,
-        master_filepaths,
-        master_id_colnames,
-        master_to_asset_list_filepath=None
+        self, master_filepaths, master_id_colnames, master_to_asset_list_filepath=None
     ):
         # TODO: This probably needs further expansion
 
@@ -3394,26 +4192,26 @@ class AssetList:
             master_data = pd.read_csv(filepath)
             # Strip columns
             master_data.columns = [c.strip() for c in master_data.columns]
-            master_data.columns = [re.sub(r'\s+', ' ', c) for c in master_data.columns]
+            master_data.columns = [re.sub(r"\s+", " ", c) for c in master_data.columns]
             # Drop any unnamed columns
             unnamed_columns = [c for c in master_data.columns if "Unnamed:" in c]
             master_data = master_data.drop(columns=unnamed_columns)
 
             if not id_map.empty:
                 master_data = master_data.merge(
-                    id_map, how="left", on=['NO.', 'Street / Block Name', 'Post Code']
+                    id_map, how="left", on=["NO.", "Street / Block Name", "Post Code"]
                 )
 
             if "INSTALLED OR CANCELLED" in master_data.columns:
                 install_col = "INSTALLED OR CANCELLED"
             elif "INSTALL / CANCELLATION DATE" in master_data.columns:
                 install_col = "INSTALL / CANCELLATION DATE"
-            elif 'INSTALL/ CANCELLATION DATE' in master_data.columns:
-                install_col = 'INSTALL/ CANCELLATION DATE'
+            elif "INSTALL/ CANCELLATION DATE" in master_data.columns:
+                install_col = "INSTALL/ CANCELLATION DATE"
             elif "INSTALL/CANCELLATION DATE" in master_data.columns:
                 install_col = "INSTALL/CANCELLATION DATE"
-            elif 'Measure 1 Install Date' in master_data.columns:
-                install_col = 'Measure 1 Install Date'
+            elif "Measure 1 Install Date" in master_data.columns:
+                install_col = "Measure 1 Install Date"
             else:
                 raise ValueError("No install or cancellation date")
 
@@ -3428,14 +4226,19 @@ class AssetList:
 
             master_data["row_id"] = master_data.index
 
-            self.standardised_asset_list["house_no"] = self.standardised_asset_list.apply(
-                lambda x: SearchEpc.get_house_number(
-                    str(x[self.STANDARD_ADDRESS_1]), str(x[self.STANDARD_POSTCODE])
-                ),
-                axis=1
+            self.standardised_asset_list["house_no"] = (
+                self.standardised_asset_list.apply(
+                    lambda x: SearchEpc.get_house_number(
+                        str(x[self.STANDARD_ADDRESS_1]), str(x[self.STANDARD_POSTCODE])
+                    ),
+                    axis=1,
+                )
             )
 
-            if "AFFORDABLE WARMTH OR EPC FOR HOUSING ASSOCIATION" in master_data.columns:
+            if (
+                "AFFORDABLE WARMTH OR EPC FOR HOUSING ASSOCIATION"
+                in master_data.columns
+            ):
                 scheme_col = "AFFORDABLE WARMTH OR EPC FOR HOUSING ASSOCIATION"
             elif "AFFORDABLE WARMTH" in master_data.columns:
                 scheme_col = "AFFORDABLE WARMTH"
@@ -3446,11 +4249,13 @@ class AssetList:
             else:
                 scheme_col = "OFFICE USE ONLY"
 
-            postcode_col = "POSTCODE" if "POSTCODE" in master_data.columns else "Post Code"
-            if 'NO.' in master_data.columns:
-                house_no_col = 'NO.'
+            postcode_col = (
+                "POSTCODE" if "POSTCODE" in master_data.columns else "Post Code"
+            )
+            if "NO." in master_data.columns:
+                house_no_col = "NO."
             elif "NO" in master_data.columns:
-                house_no_col = 'NO'
+                house_no_col = "NO"
             else:
                 house_no_col = "NUMBER"
 
@@ -3460,8 +4265,8 @@ class AssetList:
                 property_type_col = "PROPERTY TYPE As per table emailed"
             elif "PROPERTY TYPE" in master_data.columns:
                 property_type_col = "PROPERTY TYPE"
-            elif 'Property Type' in master_data.columns:
-                property_type_col = 'Property Type'
+            elif "Property Type" in master_data.columns:
+                property_type_col = "Property Type"
             else:
                 property_type_col = "PROPERTY TYPE (SEE DEEMED SCORES SHEET) Eg. 3W_Flat_1 (As per Matrix)"
 
@@ -3469,14 +4274,21 @@ class AssetList:
                 installer_notes_col = "INSTALLERS NOTES ; REASONS FOR CANCELLATIONS"
             elif "INSTALLERS NOTES" in master_data.columns:
                 installer_notes_col = "INSTALLERS NOTES"
-            elif 'Installers Notes' in master_data.columns:
-                installer_notes_col = 'Installers Notes'
-            elif 'NOTES ; REASONS FOR CANCELLATIONS OR WHERE INSTALL DATE WAS OBTAINED FROM' in master_data.columns:
-                installer_notes_col = 'NOTES ; REASONS FOR CANCELLATIONS OR WHERE INSTALL DATE WAS OBTAINED FROM'
-            elif ('INSTALLERS NOTES / REASONS FOR CANCELLATIONS / WHERE INSTALL DATE WAS RECEIVED FROM' in
-                  master_data.columns):
-                installer_notes_col = ('INSTALLERS NOTES / REASONS FOR CANCELLATIONS / WHERE INSTALL DATE WAS RECEIVED '
-                                       'FROM')
+            elif "Installers Notes" in master_data.columns:
+                installer_notes_col = "Installers Notes"
+            elif (
+                "NOTES ; REASONS FOR CANCELLATIONS OR WHERE INSTALL DATE WAS OBTAINED FROM"
+                in master_data.columns
+            ):
+                installer_notes_col = "NOTES ; REASONS FOR CANCELLATIONS OR WHERE INSTALL DATE WAS OBTAINED FROM"
+            elif (
+                "INSTALLERS NOTES / REASONS FOR CANCELLATIONS / WHERE INSTALL DATE WAS RECEIVED FROM"
+                in master_data.columns
+            ):
+                installer_notes_col = (
+                    "INSTALLERS NOTES / REASONS FOR CANCELLATIONS / WHERE INSTALL DATE WAS RECEIVED "
+                    "FROM"
+                )
             else:
                 raise ValueError("No installer notes column found in master data")
 
@@ -3491,8 +4303,8 @@ class AssetList:
 
             if "TOWN" in master_data.columns:
                 town_colname = "TOWN"
-            elif 'Town/Area' in master_data.columns:
-                town_colname = 'Town/Area'
+            elif "Town/Area" in master_data.columns:
+                town_colname = "Town/Area"
             else:
                 town_colname = "Town/City"
 
@@ -3511,8 +4323,9 @@ class AssetList:
                 if master_id_colnames[idx] is not None:
                     # Filter the standardised asset list on this
                     df = self.standardised_asset_list[
-                        self.standardised_asset_list[self.STANDARD_LANDLORD_PROPERTY_ID] == row[master_id_colnames[idx]]
-                        ]
+                        self.standardised_asset_list[self.STANDARD_LANDLORD_PROPERTY_ID]
+                        == row[master_id_colnames[idx]]
+                    ]
                     if df.shape[0] == 1:
                         matched.append(
                             {
@@ -3520,7 +4333,9 @@ class AssetList:
                                 "original_house_no": original_house_no,
                                 "original_street": original_street,
                                 "original_postcode": original_postcode,
-                                self.STANDARD_LANDLORD_PROPERTY_ID: df[self.STANDARD_LANDLORD_PROPERTY_ID].values[0],
+                                self.STANDARD_LANDLORD_PROPERTY_ID: df[
+                                    self.STANDARD_LANDLORD_PROPERTY_ID
+                                ].values[0],
                             }
                         )
                         continue
@@ -3530,7 +4345,10 @@ class AssetList:
                 df = self.standardised_asset_list[
                     (
                         self.standardised_asset_list[self.STANDARD_POSTCODE]
-                        .str.strip().str.lower().str.replace(" ", "") == postcode_no_space
+                        .str.strip()
+                        .str.lower()
+                        .str.replace(" ", "")
+                        == postcode_no_space
                     )
                 ]
 
@@ -3548,7 +4366,9 @@ class AssetList:
                     df = self.standardised_asset_list[
                         (
                             self.standardised_asset_list[self.STANDARD_POSTCODE]
-                            .str.strip().str.lower().str.startswith(postal_region)
+                            .str.strip()
+                            .str.lower()
+                            .str.startswith(postal_region)
                         )
                     ]
 
@@ -3558,7 +4378,9 @@ class AssetList:
                     df = df[df["house_no"] == house_no]
                     if df.shape[0] > 1:
                         df = df[
-                            df[self.STANDARD_FULL_ADDRESS].str.lower().str.contains(row["Street / Block Name"].lower())
+                            df[self.STANDARD_FULL_ADDRESS]
+                            .str.lower()
+                            .str.contains(row["Street / Block Name"].lower())
                         ]
                     if df.shape[0] == 0:
                         unmatched.append(row["row_id"])
@@ -3569,7 +4391,9 @@ class AssetList:
                             "original_house_no": original_house_no,
                             "original_street": original_street,
                             "original_postcode": original_postcode,
-                            self.STANDARD_LANDLORD_PROPERTY_ID: df[self.STANDARD_LANDLORD_PROPERTY_ID].values[0],
+                            self.STANDARD_LANDLORD_PROPERTY_ID: df[
+                                self.STANDARD_LANDLORD_PROPERTY_ID
+                            ].values[0],
                         }
                     )
                     continue
@@ -3579,44 +4403,71 @@ class AssetList:
                     if df.shape[0] != 1:
                         # Levenstein distance
 
-                        if any(df[self.STANDARD_FULL_ADDRESS].str.contains(row["Street / Block Name"])):
+                        if any(
+                            df[self.STANDARD_FULL_ADDRESS].str.contains(
+                                row["Street / Block Name"]
+                            )
+                        ):
                             df = df[
-                                df[self.STANDARD_FULL_ADDRESS].str.contains(row["Street / Block Name"])
+                                df[self.STANDARD_FULL_ADDRESS].str.contains(
+                                    row["Street / Block Name"]
+                                )
                             ]
                         else:
                             # Levenstein distance
                             df = df[
-                                df[self.STANDARD_FULL_ADDRESS].str.lower().apply(
+                                df[self.STANDARD_FULL_ADDRESS]
+                                .str.lower()
+                                .apply(
                                     lambda x: process.extractOne(
                                         " ".join(
-                                            [row[house_no_col], row["Street / Block Name"], row[town_colname]]).lower(),
-                                        x
+                                            [
+                                                row[house_no_col],
+                                                row["Street / Block Name"],
+                                                row[town_colname],
+                                            ]
+                                        ).lower(),
+                                        x,
                                     )[1]
-                                ) > 90
-                                ]
+                                )
+                                > 90
+                            ]
 
                             if df.shape[0] == 0:
                                 unmatched.append(row["row_id"])
                                 continue
 
-                        if any(df[self.STANDARD_FULL_ADDRESS].str.lower().str.contains(
-                            " ".join([row[house_no_col], row["Street / Block Name"]]).lower()
-                        )):
+                        if any(
+                            df[self.STANDARD_FULL_ADDRESS]
+                            .str.lower()
+                            .str.contains(
+                                " ".join(
+                                    [row[house_no_col], row["Street / Block Name"]]
+                                ).lower()
+                            )
+                        ):
                             df = df[
-                                df[self.STANDARD_FULL_ADDRESS].str.lower().str.contains(
-                                    " ".join([row[house_no_col], row["Street / Block Name"]]).lower()
+                                df[self.STANDARD_FULL_ADDRESS]
+                                .str.lower()
+                                .str.contains(
+                                    " ".join(
+                                        [row[house_no_col], row["Street / Block Name"]]
+                                    ).lower()
                                 )
                             ]
 
                         if any(
-                            df[self.STANDARD_PROPERTY_TYPE].str.contains(row[property_type_col].split(" ")[-1].lower())
+                            df[self.STANDARD_PROPERTY_TYPE].str.contains(
+                                row[property_type_col].split(" ")[-1].lower()
+                            )
                         ):
                             # We ignore "block of flats" entries
                             df = df[
                                 df[self.STANDARD_PROPERTY_TYPE].str.contains(
                                     row[property_type_col].split(" ")[-1].lower()
-                                ) & (df[self.STANDARD_PROPERTY_TYPE] != "block of flats")
-                                ]
+                                )
+                                & (df[self.STANDARD_PROPERTY_TYPE] != "block of flats")
+                            ]
 
                         if df.shape[0] != 1:
                             # We have multiple matches - it's likely because the landlord has a duplicate
@@ -3628,7 +4479,9 @@ class AssetList:
                                         "original_house_no": original_house_no,
                                         "original_street": original_street,
                                         "original_postcode": original_postcode,
-                                        self.STANDARD_LANDLORD_PROPERTY_ID: x[self.STANDARD_LANDLORD_PROPERTY_ID],
+                                        self.STANDARD_LANDLORD_PROPERTY_ID: x[
+                                            self.STANDARD_LANDLORD_PROPERTY_ID
+                                        ],
                                     }
                                 )
                             continue
@@ -3639,11 +4492,15 @@ class AssetList:
                             "original_house_no": original_house_no,
                             "original_street": original_street,
                             "original_postcode": original_postcode,
-                            self.STANDARD_LANDLORD_PROPERTY_ID: df[self.STANDARD_LANDLORD_PROPERTY_ID].values[0],
+                            self.STANDARD_LANDLORD_PROPERTY_ID: df[
+                                self.STANDARD_LANDLORD_PROPERTY_ID
+                            ].values[0],
                         }
                     )
 
-            self.standardised_asset_list = self.standardised_asset_list.drop(columns="house_no")
+            self.standardised_asset_list = self.standardised_asset_list.drop(
+                columns="house_no"
+            )
 
             # We match the "UPRN" which is the landlords ID, onto the master sheet
 
@@ -3654,19 +4511,29 @@ class AssetList:
             if matched.empty:
                 continue
 
-            master_to_append = master_data[
-                [scheme_col, "row_id", install_col, submission_col, measure_mix_col, installer_notes_col, installer_col]
-            ].merge(
-                matched, how="left", on="row_id"
-            ).rename(
-                columns={
-                    scheme_col: "funding_scheme",
-                    measure_mix_col: "measure_mix",
-                    install_col: "survey_status",
-                    submission_col: "submission_date",
-                    installer_notes_col: "submission_installer_notes",
-                    installer_col: "submission_installer"
-                }
+            master_to_append = (
+                master_data[
+                    [
+                        scheme_col,
+                        "row_id",
+                        install_col,
+                        submission_col,
+                        measure_mix_col,
+                        installer_notes_col,
+                        installer_col,
+                    ]
+                ]
+                .merge(matched, how="left", on="row_id")
+                .rename(
+                    columns={
+                        scheme_col: "funding_scheme",
+                        measure_mix_col: "measure_mix",
+                        install_col: "survey_status",
+                        submission_col: "submission_date",
+                        installer_notes_col: "submission_installer_notes",
+                        installer_col: "submission_installer",
+                    }
+                )
             )
             master_to_append["submission_cancelled"] = (
                 master_to_append["survey_status"].str.lower().str.contains("cancel")
@@ -3675,14 +4542,17 @@ class AssetList:
                 master_to_append["survey_status"].str.lower().str.contains("installed")
             )
             master_surveyed.append(master_to_append)
-            unmatched_df = master_data[
-                master_data["row_id"].isin(unmatched)
-            ]
+            unmatched_df = master_data[master_data["row_id"].isin(unmatched)]
 
             # The columns are massively different - we take just a few
             unmatched_df = unmatched_df[
                 [
-                    scheme_col, house_no_col, "Street / Block Name", postcode_col, install_col, submission_col
+                    scheme_col,
+                    house_no_col,
+                    "Street / Block Name",
+                    postcode_col,
+                    install_col,
+                    submission_col,
                 ]
             ].rename(
                 columns={
@@ -3690,14 +4560,16 @@ class AssetList:
                     house_no_col: "House Number",
                     postcode_col: "Postcode",
                     install_col: "survey_status",
-                    submission_col: "submission_date"
+                    submission_col: "submission_date",
                 }
             )
 
             unmatched_submissions.append(unmatched_df)
 
         master_surveyed = pd.concat(master_surveyed)
-        master_surveyed = master_surveyed[~pd.isnull(master_surveyed[self.STANDARD_LANDLORD_PROPERTY_ID])]
+        master_surveyed = master_surveyed[
+            ~pd.isnull(master_surveyed[self.STANDARD_LANDLORD_PROPERTY_ID])
+        ]
         master_surveyed = master_surveyed[
             ~master_surveyed[self.STANDARD_LANDLORD_PROPERTY_ID].isin(
                 ["NOT ON ASSET LIST", "Missing From Asset List"]
@@ -3709,20 +4581,24 @@ class AssetList:
         ].astype(str)
 
         # We de-dupe crudely on landlord property id
-        self.master_surveyed = master_surveyed.drop_duplicates(subset=[self.STANDARD_LANDLORD_PROPERTY_ID]).copy()
+        self.master_surveyed = master_surveyed.drop_duplicates(
+            subset=[self.STANDARD_LANDLORD_PROPERTY_ID]
+        ).copy()
 
         # We now add the submission status, based on the hubspot stages
-        self.master_surveyed["submission_status"] = hubspot_config.HubspotProcessStatus.SUBMITTED_TO_INSTALLER.label
+        self.master_surveyed["submission_status"] = (
+            hubspot_config.HubspotProcessStatus.SUBMITTED_TO_INSTALLER.label
+        )
         self.master_surveyed["submission_status"] = np.where(
             self.master_surveyed["submission_cancelled"] == True,
             hubspot_config.HubspotProcessStatus.INSTALLER_CANCELLED_FINALIZED.label,
-            self.master_surveyed["submission_status"]
+            self.master_surveyed["submission_status"],
         )
 
         self.master_surveyed["submission_status"] = np.where(
             self.master_surveyed["submission_installed"] == True,
             hubspot_config.HubspotProcessStatus.INSTALL_COMPLETE.label,
-            self.master_surveyed["submission_status"]
+            self.master_surveyed["submission_status"],
         )
 
         self.standardised_asset_list = self.standardised_asset_list.merge(
@@ -3735,6 +4611,4 @@ class AssetList:
 
         # Finally, we keep a record of the unmatched
         if unmatched_submissions:
-            self.unmatched_submissions = pd.concat(
-                unmatched_submissions
-            )
+            self.unmatched_submissions = pd.concat(unmatched_submissions)
diff --git a/asset_list/app.py b/asset_list/app.py
index b9c6bcf0..3e492118 100644
--- a/asset_list/app.py
+++ b/asset_list/app.py
@@ -18,6 +18,7 @@ EPC_AUTH_TOKEN = os.getenv(
     "EPC_AUTH_TOKEN",
 )
 
+
 OPENAI_API_KEY = os.getenv(
     "OPENAI_API_KEY",
 )
@@ -73,61 +74,24 @@ def app():
     Property UPRN
     """
 
-    data_folder = "/Users/khalimconn-kowlessar/Documents/hestia/Customers/West Kent"
-    data_filename = "West Kent Asset List.xlsx"
+    data_folder = "/workspaces/model/asset_list"
+    data_filename = "assests.xlsx"
     sheet_name = "Sheet1"
-    postcode_column = "POSTCODE"
-    address1_column = None
+    postcode_column = "Postcode"
+    address1_column = "Address"
     address1_method = "house_number_extraction"
-    fulladdress_column = "ADDRESS"
-    address_cols_to_concat = []
+    fulladdress_column = None
+    address_cols_to_concat = ["Address"]
     missing_postcodes_method = None
     landlord_year_built = None
-    landlord_os_uprn = None
-    landlord_property_type = "PROPERTY TYPE"
-    landlord_built_form = None
-    landlord_wall_construction = "wall combined"
-    landlord_roof_construction = "HEATING SYSTEM"
-    landlord_heating_system = None
+    landlord_os_uprn = "UPRN"
+    landlord_property_type = "Archetype"
+    landlord_built_form = "Bedroom Count"
+    landlord_wall_construction = "Wall Insulation Type"
+    landlord_roof_construction = "Roof Type"
+    landlord_heating_system = "Boiler Type"
     landlord_existing_pv = None
-    landlord_property_id = "UPRN"
-    landlord_sap = None
-    outcomes_filename = None
-    outcomes_sheetname = None
-    outcomes_postcode = None
-    outcomes_houseno = None
-    outcomes_id = None
-    outcomes_address = None
-    master_filepaths = []
-    master_id_colnames = []
-    master_to_asset_list_filepath = None
-    phase = False
-    ecosurv_landlords = None
-    asset_list_header = 0
-    landlord_block_reference = None
-
-    # Peabody data for cleaning
-    data_folder = (
-        "/Users/khalimconn-kowlessar/Documents/hestia/Customers/Peabody/Nov 2025 Consulting "
-        "Project/data_validation"
-    )
-    data_filename = "to_standardise_uprns.xlsx"
-    sheet_name = "Sheet1"
-    postcode_column = "POSTCODE"
-    address1_column = None
-    address1_method = "house_number_extraction"
-    fulladdress_column = "ADDRESS"
-    address_cols_to_concat = []
-    missing_postcodes_method = None
-    landlord_year_built = None
-    landlord_os_uprn = None
-    landlord_property_type = "PROPERTY TYPE"
-    landlord_built_form = None  # Skipped as empty
-    landlord_wall_construction = "wall combined"  # combin F + G
-    landlord_roof_construction = "HEATING SYSTEM"  # Combine I + J
-    landlord_heating_system = None  # Check with Khalim
-    landlord_existing_pv = None
-    landlord_property_id = "UPRN"
+    landlord_property_id = "Tab"
     landlord_sap = None
     outcomes_filename = None
     outcomes_sheetname = None
diff --git a/asset_list/requirements.txt b/asset_list/requirements.txt
index dc7e572e..56469fc0 100644
--- a/asset_list/requirements.txt
+++ b/asset_list/requirements.txt
@@ -5,7 +5,7 @@ epc-api-python==1.0.2
 thefuzz
 boto3
 openpyxl
-openai>=1.3.5
+openai==1.93.0
 tiktoken
 msgpack
 beautifulsoup4
diff --git a/infrastructure/terraform/lambda/_template/main.tf b/infrastructure/terraform/lambda/_template/main.tf
index 7f60d684..89e6c4c1 100644
--- a/infrastructure/terraform/lambda/_template/main.tf
+++ b/infrastructure/terraform/lambda/_template/main.tf
@@ -33,6 +33,8 @@ module "lambda" {
 
   image_uri = local.image_uri
 
+  # Optional: Set maximum_concurrency to limit concurrent SQS-triggered invocations (2-1000)
+  maximum_concurrency = var.maximum_concurrency
 
   environment = {
     STAGE = var.stage
diff --git a/infrastructure/terraform/lambda/_template/variables.tf b/infrastructure/terraform/lambda/_template/variables.tf
index e4bab243..e0061321 100644
--- a/infrastructure/terraform/lambda/_template/variables.tf
+++ b/infrastructure/terraform/lambda/_template/variables.tf
@@ -17,6 +17,11 @@ variable "image_digest" {
   description = "Image digest (sha256:...)"
 }
 
+variable "maximum_concurrency" {
+  type        = number
+  default     = null
+  description = "Maximum number of concurrent Lambda invocations from SQS (2-1000). null = no limit."
+}
 
 locals {
   image_uri = "${var.ecr_repo_url}@${var.image_digest}"
diff --git a/infrastructure/terraform/lambda/address2UPRN/main.tf b/infrastructure/terraform/lambda/address2UPRN/main.tf
index f53d55c8..2d185497 100644
--- a/infrastructure/terraform/lambda/address2UPRN/main.tf
+++ b/infrastructure/terraform/lambda/address2UPRN/main.tf
@@ -24,6 +24,9 @@ module "address2uprn" {
 
   timeout = 900
 
+  # Optional: Set maximum_concurrency to limit concurrent SQS-triggered invocations (2-1000)
+  maximum_concurrency = var.maximum_concurrency
+
   environment = merge(
     {
       STAGE     = var.stage
diff --git a/infrastructure/terraform/lambda/address2UPRN/variables.tf b/infrastructure/terraform/lambda/address2UPRN/variables.tf
index e4bab243..e0061321 100644
--- a/infrastructure/terraform/lambda/address2UPRN/variables.tf
+++ b/infrastructure/terraform/lambda/address2UPRN/variables.tf
@@ -17,6 +17,11 @@ variable "image_digest" {
   description = "Image digest (sha256:...)"
 }
 
+variable "maximum_concurrency" {
+  type        = number
+  default     = null
+  description = "Maximum number of concurrent Lambda invocations from SQS (2-1000). null = no limit."
+}
 
 locals {
   image_uri = "${var.ecr_repo_url}@${var.image_digest}"
diff --git a/infrastructure/terraform/lambda/modules/lambda_with_sqs/main.tf b/infrastructure/terraform/lambda/modules/lambda_with_sqs/main.tf
index 065fb790..74345d24 100644
--- a/infrastructure/terraform/lambda/modules/lambda_with_sqs/main.tf
+++ b/infrastructure/terraform/lambda/modules/lambda_with_sqs/main.tf
@@ -44,5 +44,6 @@ module "sqs_trigger" {
   lambda_role_name = module.role.role_name
   queue_arn        = module.queue.queue_arn
 
-  batch_size = var.batch_size
+  batch_size           = var.batch_size
+  maximum_concurrency  = var.maximum_concurrency
 }
diff --git a/infrastructure/terraform/lambda/modules/lambda_with_sqs/variables.tf b/infrastructure/terraform/lambda/modules/lambda_with_sqs/variables.tf
index b20ab2a8..7c2832d2 100644
--- a/infrastructure/terraform/lambda/modules/lambda_with_sqs/variables.tf
+++ b/infrastructure/terraform/lambda/modules/lambda_with_sqs/variables.tf
@@ -34,3 +34,9 @@ variable "batch_size" {
   type    = number
   default = 10
 }
+
+variable "maximum_concurrency" {
+  type        = number
+  default     = null
+  description = "Maximum number of concurrent Lambda invocations from SQS. null = no limit."
+}
diff --git a/infrastructure/terraform/modules/lambda_sqs_trigger/main.tf b/infrastructure/terraform/modules/lambda_sqs_trigger/main.tf
index 5919e10f..4afaf773 100644
--- a/infrastructure/terraform/modules/lambda_sqs_trigger/main.tf
+++ b/infrastructure/terraform/modules/lambda_sqs_trigger/main.tf
@@ -3,6 +3,13 @@ resource "aws_lambda_event_source_mapping" "this" {
   function_name    = var.lambda_arn
   batch_size       = var.batch_size
   enabled          = true
+
+  dynamic "scaling_config" {
+    for_each = var.maximum_concurrency != null ? [1] : []
+    content {
+      maximum_concurrency = var.maximum_concurrency
+    }
+  }
 }
 
 resource "aws_iam_role_policy" "allow_sqs" {
diff --git a/infrastructure/terraform/modules/lambda_sqs_trigger/variables.tf b/infrastructure/terraform/modules/lambda_sqs_trigger/variables.tf
index 0e50cd54..c3127c74 100644
--- a/infrastructure/terraform/modules/lambda_sqs_trigger/variables.tf
+++ b/infrastructure/terraform/modules/lambda_sqs_trigger/variables.tf
@@ -6,3 +6,9 @@ variable "batch_size" {
   type    = number
   default = 10
 }
+
+variable "maximum_concurrency" {
+  type        = number
+  default     = null
+  description = "Maximum number of concurrent Lambda invocations from SQS. null = no limit."
+}

From c2196b6e0d6b0ddaabf6a0d3cf973614439c3476 Mon Sep 17 00:00:00 2001
From: Jun-te Kim <junte.kim@mealcraft.com>
Date: Wed, 18 Feb 2026 12:23:29 +0000
Subject: [PATCH 3/3] 10 address 2uprn

---
 infrastructure/terraform/lambda/address2UPRN/variables.tf | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/infrastructure/terraform/lambda/address2UPRN/variables.tf b/infrastructure/terraform/lambda/address2UPRN/variables.tf
index e0061321..347964de 100644
--- a/infrastructure/terraform/lambda/address2UPRN/variables.tf
+++ b/infrastructure/terraform/lambda/address2UPRN/variables.tf
@@ -19,7 +19,7 @@ variable "image_digest" {
 
 variable "maximum_concurrency" {
   type        = number
-  default     = null
+  default     = 10 # null if you don't want to set it for this handler
   description = "Maximum number of concurrent Lambda invocations from SQS (2-1000). null = no limit."
 }