employees = spark.createDataFrame([
(1, "Олена Петренко", "Data Science", 45000, "Київ,Львів", "2022-03-15"),
(2, "Андрій Коваленко", "Engineering", 52000, "Харків", None),
(3, "Марія Шевченко", None, 48000, "Одеса,Київ,Дніпро", "2023-01-10"),
(4, "Петро Бондаренко", "Engineering", None, "Львів", "2020-11-20"),
(5, "Ірина Мельник", "Marketing", 42000, None, "2021-08-05"),
(6, "Сергій Ткаченко", None, None, "Київ", None),
], schema=["id", "name", "department", "salary", "cities", "start_date"])
employees.show(truncate=False)