# Extended Applications: Python Übung

<div style="display:flex;">
    <div style="text-align: left">
        Willkommen zur dritten Programmierübung Einführung in Python 3
    </div>
    <img style="float: right; margin: 0px 15px 15px 0px" src="https://www.python.org/static/img/python-logo-large.c36dccadd999.png?1576869008" width="100" />
</div>

In dieser Übung werden erweiterte Konzepte gelernt, welche das Konzipieren von Programmen stark vereinfacht.

Wenn Sie Fragen oder Verbesserungsvorschläge zum Inhalt oder Struktur der Notebooks haben, dann können sie eine E-Mail an Phil Keier ([p.keier@hbk-bs.de](mailto:p.keier@hbk-bs.de?subject=[SigSys]%20Feedback%20Programmierübung&amp)) oder Martin Le ([martin.le@tu-bs.de](mailto:martin.le@tu-bs.de?subject=[SigSys]%20Feedback%20Programmierübung&amp)) schreiben.

Link zu einem Python Spickzettel: [hier](https://s3.amazonaws.com/assets.datacamp.com/blog_assets/PythonForDataScience.pdf)

Der Großteil des Python-Tutorials stammt aus der Veranstaltung _Deep Learning Lab_ und von [www.python-kurs.eu](https://www.python-kurs.eu/python3_kurs.php) und wurde für _Signale und Systeme_, sowie _Einführung in die Programmierung für Nicht Informatiker_ angepasst.

# Konventionen

Python hat einen Grundlegenden Styleguide 2001 von Guido van Rossum festgelegt in [PEP 8](https://peps.python.org/pep-0008/).

Dazu nur ein paar Anmerkungen:

1. Variabel- & Funktionsnamen werden immer kleingeschrieben und mittels "snake case" geschrieben. Bsp.: `is_alive`
2. Zum Einrücken sollten 4 Leerzeichen verwendet werden die mit Tab eingeleitet werden. (Jupyter macht dies Automatisch richtig)
3. Beim schreiben von Kommentaren folgt nach `#` immer ein Leerzeichen. Bsp.: `# Kommentar`
4. Importe aus Modulen sollen getrennt sein.

   Richtig:
   ```python
   import os
   import sys
   ```
   
   Falsch:
   ```python
   import os, sys
   ```

5. Mehrfach importe aus einem Modul sind dennoch mit `,` gern gesehen.

   Bsp.:
   ```python
   from dataclass import dataclass, field, asdict
   ```

6. Nach jedem `,`, `:`(außer beim slicing) und operator `+, =, etc.` folgt ein Leerzeichen.
  
   Bsp.:
   ```python
   x = 4 + 2
   arr[5:10]
   ```

7. Kein unnötiges Ausrichten von Variablen.

    So nicht:
   ```python
   x    = 4
   y    = 5
   name = "Lisa"
   ```

8. Die Variablnamen `l` (Kleingeschriebenes L), `O` (Großes o) und `I` (Großes i) sollten niemals als Einzelvariablennamen verwendet werden, da diese Schwer von `i` (Kleines i), `0`(Die Zahl Null) und `L` (Großes L) in einigen Schriftarten zu unterscheiden sind. (Sollte mit Jupyter kein Problem darstellen)

# Generatoren

Nachdem wir bereits Funktionen kennengelernt haben, welche einen Rückgabewert haben, lernen wir nun ein Python Konzept kennen, dass "On the fly" Daten zur Verfügung stellt.

Bisher sind wir davon ausgegangen das beispielweise die Funktion `range` eine Liste zurückgibt. Dies ist vom Gedanken her richtig, dennoch nicht in der Umsetzung.

Mit einem einfachen `print` lässt sich dies auch bestätigen:

In [3]:
print(range(10))

range(0, 10)


Statt wie vielleicht zu erwarten die Liste von werten `0...9` als Ausgabe zu bekommen, gibt uns Python lediglich `range(0, 10)` zurück.

Möchte man die Werte direkt evaluiert haben muss der `*`-Operator verwendet werden:

In [4]:
print(*range(10))

0 1 2 3 4 5 6 7 8 9


Dabei verändert `range(10)` die `print` Funktion indem es alle Generator Werte als Parameter einsetzt `print(0,1,2,3,4,5,6,7,8,9)` und danach aufruft.

Um selber einen Generator zu definieren benötigt man das Python Keyword `yield`. Im Gegensatz zum Normalen `return` wird die Berechnung nur gestoppt und zu einem späteren Zeitpunkt ausgeführt. Sozusagen hat der Generator ein veränderbaren Zustand.

Die Syntax hierzu ist im Allgemeinen:

```python
def <funktion-name>(<parameterliste>):
    # do something
    yield <ergebnis>
```

Eine rudimentäre Funktion `count_to` lässt sich dementsprechend wie folgt definieren:

In [27]:
def count_to(n):
    count = 0
    while count < n:
        yield count
        count += 1

print("This is a Generator:", count_to(10))
print("This Generator evaluates to:", *count_to(10))

This is a Generator: <generator object count_to at 0x1124431c0>
This Generator evaluates to: 0 1 2 3 4 5 6 7 8 9


Selbiges mit einem For Loop:

In [28]:
def count_to(n):
    for i in range(n):
        yield i

print("This is a Generator:", count_to(10))
print("This Generator evaluates to:", *count_to(10))

This is a Generator: <generator object count_to at 0x112ae1700>
This Generator evaluates to: 0 1 2 3 4 5 6 7 8 9


### Aufgabe

*3 Punkte*

Schreibe einen Generator `square_count` mit einem Eingabeparameter `n`, welcher die Quadratzahlen von $1\dots n^2$ ausgibt.

Die Aufgabe gibt 0 Punkte, wenn die Funktion `square_count` kein Generator ist!

Hinweis: Bei Eingabe von `5` soll die Ausgabe `1 4 9 16` sein.

In [57]:
# BEGIN SOLUTION
def square_count(n):    
    for i in range(1, n):
        yield i*i
# END SOLUTION

In [90]:
# Hier werden die Loesungen getestet...

# Check if the generator has the right name
assert "square_count" in dir() # 1 Punkt

# Check if square_count is a generator
import types
assert isinstance(square_count(1), types.GeneratorType) # 1 Punkt

# Check if the generator generates the right output
for n in range(10):    
    assert [i*i for i in range(1,n)] == [i for i in square_count(n)] # 1 Punkt

# print
for n in range(2, 7):
    print(f"Square Numbers from 0 to {n-1}:", *square_count(n))

Square Numbers from 0 to 1: 1
Square Numbers from 0 to 2: 1 4
Square Numbers from 0 to 3: 1 4 9
Square Numbers from 0 to 4: 1 4 9 16
Square Numbers from 0 to 5: 1 4 9 16 25


Generatoren können auch eine unendliche Menge an Daten zurückgeben. Dieses Ziel kann man erreichen indem der Generator unendlich oft ausgeführt wird. Da die Daten zur Laufzeit berechnet werden kann man von einer unendlichen Menge sprechen.

Um eine Berechnung nie enden zu lassen muss die Bedingung der Schleife immer `wahr` bleiben.
Dies erreicht man durch die Syntax `while True:`, aber Python ist eben Python und die Syntax `while 1:` ist Laufzeit effizienter.

Schauen wir uns nun das Beispiel eines unendlichen Generator an der Fortwährend die nächste Fakultät ausgibt:


In [15]:
def faktoriel_gen():
    curr = 1
    count = 1
    while 1:
        curr = count * curr
        count += 1
        yield curr

Vorsicht (!!) wertet man diesen Generator nun aus würde die Berechnung niemals enden. Um den nächsten Wert der Berechnung zu erhalten hat Python die Funktion `next`, welche den nächsten Zustand des Generators ausgibt. Mit einem `for`-loop und `next` lassen sich dann die Fakultäten der Zahlen bis `5` einfach ausgeben:

In [18]:
gen = faktoriel_gen()

for _ in range(5):
    print(next(gen))

1
2
6
24
120


Da der Zustand des Generator gespeichert ist lässt sich mit einem weiteren aufruf in nächster Zelle auf $6! = 720$ ausgeben:

In [19]:
print(next(gen))

720


### Aufgabe

*3 Punkte*

Schreibe einen Generator `naturals`, welcher mit jedem Aufruf die nächste natürliche Zahl ausgibt. (Angefangen mit 1)

- Es sind keine Eingabeparameter notwendig.
- Ist die Funktion kein generator, wird diese Aufgabe mit 0 Punkten bewertet

*Hinweis*: Orientiere dich an dem Beispiel `faktoriel_gen`

In [60]:
# BEGIN SOLUTION
def naturals():
    curr = 1
    while 1:
        yield curr
        curr += 1
# END SOLUTION

In [91]:
# Hier werden die Loesungen getestet...

# Check if generator is named properly
assert "naturals" in dir() # 1 Punkt

# Check if naturals is a generator
import types
assert isinstance(naturals(), types.GeneratorType) # 1 Punkt

# Test if generator works as intended
import random
test_n = random.randint(5, 17)
test_gen = naturals()
for i in range(1, test_n):
    number = next(test_gen)
    print(number, end=', ')
    assert i == number # 1 Punkt

1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 

# Type Hints

Mit [PEP 484](https://peps.python.org/pep-0484/) wurden in Python die `type hints` eingeführt. Die Motivation dafür war es eine Standard Syntax zu definieren, welche einem die Möglichkeit gibt den In- und Output von Funktionen besser zu bestimmen. Unter anderem verbessert sich die Testbarkeit von Python Programmen ungemein wenn Type Hints vorhanden sind. Im Allgemeinen werden `type hints` daher verwendet, um von Variablen und Funktionen die Typen (`int`, `float`, `dict`, etc.) anzuzeigen.

Die Allgemeine Syntax dafür:
```python
def <funktions-name>(<parameter1>: <type>, <parameter2>: <type>) -> <output-type>:
    # do something
    return <value of definied output-type>
```

Python ist eine dynamische typisierte Sprache. Das heißt, dass der Typ einer Variable immer wieder überprüft werden muss. So kann eine Ganzzahl `int` mit einer einfachen addition in eine Flieskommazahl `float` überführt werden:

In [88]:
number = 3
print(number, type(number))
number += 0.14
print(number, type(number))

3 <class 'int'>
3.14 <class 'float'>


Um diese unerwünschten Typenwechsel zu vermeiden, kann man type hints verwenden. Type hints sind nur eine Info keine Garantie das der Typ einer Variable sich ändert!

Eine nutzlose Funktion die den Eingabewert als `int` in einen `str` umwandelt sieht wie folgt aus:

In [29]:
def useless(number: int) -> str:
    return "Number {}".format(number)

print(useless(42))

Number 42


Um anzuzeigen das eine Variable einen bestimmten Datentypen zugeordnet ist wird folgende Syntax verwendet:

In [89]:
name: str = "Peter Parker"

# Dataclasses 

Allgemein auf Klassen wird hier nicht eingegangen jedoch ein Konzept, welches mit [PEP 557](https://peps.python.org/pep-0557/) eingeführt wurde, soll folgend stärker beleuchtet werden.

Datenstruckturen wie `dict`, `set`, `list`, etc. sind mächtige Werkzeuge und ermöglichen dem Programmierer Daten in vielen Formen akkurat dazustellen. Möchte man jedoch feste Datenstrukturen mit genau definierten Werten verwenden eignet sich das Modul `dataclasses`.

Dazu wird eine Klasse mit dem Keyword `class` definiert und dem Decorator `dataclasses.dataclass` ausgesattet. Folglich können feste Datenobjekte mit definierter Struktur erstellt werden.

Zunächst wird das Modul aus der Standard Bibliothek importiert:

In [68]:
from dataclasses import dataclass

Danach kann eine Klasse erstellt werden. Erstellen wir zunächst eine Klasse `Person`, welche die Werte `vorname` und `nachname` als Strings bereitstellen soll:

Wichtig: Python Klassen fangen immer mit einem Großbuchstaben an. Mit Ausnahme der Standard Bibliothek. Die `range` Funktion lässt sich zwar verwenden wie eine Funktion, ist aber eigentlich eine Klasse!

In [17]:
@dataclass
class Person:
    vorname: str
    nachname: str

Möchten wir nun eine Person erstellen sieht dies wie folgt aus:

In [18]:
person = Person("Eduard", "Jorswieck")
print(person, type(person))

Person(vorname='Eduard', nachname='Jorswieck') <class '__main__.Person'>


Wie dem Output zu entnehmen ist die Variable `person` ein Objekt vom Typ `Person` und hält die Werte `vorname='Eduard'` und `nachname='Jorswieck'` vor.

Auf die einzelnen Werte innerhalb der Dataclass kann nun per `.` Operator zugegriffen werden:

In [19]:
print("Vorname:", person.vorname)
print("Nachname:", person.nachname)

Vorname: Eduard
Nachname: Jorswieck


Dataclasses bieten auch den Vorteil, dass ihre Werte direkt über die Variablennamen definiert werden können. Dabei spielt die Reihenfolge dann keine Rolle mehr.

In [20]:
person2 = Person(nachname="Le", vorname="Martin")
print(person2, type(person2))

Person(vorname='Martin', nachname='Le') <class '__main__.Person'>


Nicht immer sind alle Werte vorhanden und damit dies nicht zum Problem wird können Standardwerte vergeben werden:

In [25]:
@dataclass
class Person:
    vorname: str = "Max"
    nachname: str = "Mustermann"

Wird nun eine Dataclass ohne Eingabeparameter erstellt, werden ihr ihre Standardwerte zugewiesen:

In [27]:
nameless_person = Person()
print("Aufruf mit print:", nameless_person) 

Aufruf mit print: Person(vorname='Max', nachname='Mustermann')


### Aufgabe

*6 Punkte*

Schreiben Sie eine Dataclass `Student`

- Die dataclass soll die Werte `vorname`, `nachname`, `semester` und `mat_nr` speichern, vergebe hierzu selber den !!geeigneten!! Datentypen. Mache dir dazu Gedanken ob es Sinnvoll beispielweise die Semesteranzahl als Float zu speichern.

- importiere aus dem dataclasses modul die Funktion `asdict`, erstelle ein Objekt mit den Werten aus dem Beispielstundent, weiße den rückgabewert aus `asdict` aufgerufen mit dem Beispielstudenten der Variablen `stud` zu.

- Die Aufgabe wird mit 0 Punkten bewertet, wenn `Student` keine dataclass ist!

- Hat einer der Attribute keinen geeigneten Datentypen, führt dies nicht zu Punktabzug bei zwei oder mehr schon.

Beispielstudent:

|Attribut|Wert|
|-|-|
|vorname|Martin|
|nachname|Le|
|mat_nr|520420|
|semester|5|

In [75]:
# BEGIN SOLUTION
from dataclasses import asdict

@dataclass
class Student:
    vorname: str
    nachname: str
    mat_nr: int
    semester: int 

stud = asdict(Student(vorname='Martin', nachname='Le', mat_nr=520420, semester=5))
# END SOLUTION

In [87]:
# Hier werden die Loesungen getestet...

# Check if asdict is imported
assert "asdict" in dir() # 1 Punkt

# Check if Student is named properly
assert "Student" in dir() # 1 Punkt

# Check if Student is a Dataclassimport dataclasses
from dataclasses import is_dataclass
assert is_dataclass(Student) # 1 Punkt

# Check if stud is properly converted from Dataclass to dict
# 3 Punkt
assert stud == {'vorname': 'Martin', 'nachname': 'Le', 'mat_nr': 520420, 'semester': 5}
print(stud)

{'vorname': 'Martin', 'nachname': 'Le', 'mat_nr': 520420, 'semester': 5}


### Aufgabe

*6 Punkte*

Gegeben sind zwei Listen `colorn` & `colorv_hex`, welche zueinander Index Sortiert sind.

Schreiben nun eine Dataclass `Color` mit den Attributen `name` & `value` und vergebe geeignete Type Hints.

Erstelle danach eine Liste, welche die Werte aus `colorn` & `colorv_hex` in die Dataclass `Color` umwandeln, und speicher die Liste in der variablen `colors`.


In [106]:
colorn = ['RED', 'GREEN', 'BLUE', 'YELLOW', 'PURPLE']
colorv_hex = ['#FF0000', '#00FF00', '#0000FF', '#FFFF00', '#FF00FF']

In [107]:
colors = None
# BEGIN SOLUTION
@dataclass
class Color:
    name: str
    value: str

colors = [Color(n, w) for n, w in zip(colorn, colorv_hex)]
    
print(colors)
# END SOLUTION

[Color(name='RED', value='#FF0000'), Color(name='GREEN', value='#00FF00'), Color(name='BLUE', value='#0000FF'), Color(name='YELLOW', value='#FFFF00'), Color(name='PURPLE', value='#FF00FF')]


In [108]:
# Hier werden die Loesungen getestet...

# Check if Color is named properly
assert "Color" in dir() 

# Check if Color is a Dataclassimport dataclasses
from dataclasses import is_dataclass
assert is_dataclass(Color) # 1 Punkt

# Check if colors is a list
assert isinstance(colors, list) # 1 Punkt

# Check if colors contains only Color Classes 
for c in colors:
    assert is_dataclass(c) # 1 Punkt

### BEGIN HIDDEN TEST
@dataclass
class Color:
    name: str
    value: str

c = [Color(n, w) for n, w in zip(colorn, colorv_hex)]
for r, s in zip(c, colors):
    assert r.name == s.name
    assert r.value == s.value
### END HIDDEN TEST

print(colors) # 3 Punkte

[Color(name='RED', value='#FF0000'), Color(name='GREEN', value='#00FF00'), Color(name='BLUE', value='#0000FF'), Color(name='YELLOW', value='#FFFF00'), Color(name='PURPLE', value='#FF00FF')]


# Walrus Operator - Assingment Expressions

Der Grund warum Guido van Rossum das Python Projekt verlassen hat, ist der Walrus Operator `:=`, zu finden unter [PEP 572](https://peps.python.org/pep-0572/). 

Das Offizielle Statement:

> "The straw that broke the camel's back was a very contentious Python enhancement proposal, where after I had accepted it, people went to social media like Twitter and said things that really hurt me personally. And some of the people who said hurtful things were actually core Python developers, so I felt that I didn't quite have the trust of the Python core developer team anymore."
> - Guido van Rossum

Das Problem der Operator `:=` fügt keinerlei neue Funktionalität hinzu und erlaubt einzig und allein eine Zuweisung während einer Auswertung zu erlauben.

Daher ein paar kurze Beispiele, lesen Sie ansonsten gerne PEP 572.

Zuweisung mittels Walrus Operator: (Machen Sie das bitte nicht nach, Niemand wirklich Niemand möchte das sehen!)

In [8]:
# Normale Zuweisung
walrus = True
print(walrus)

# Walrus Zuweisung
(walrus := False)
print(walrus)

True
False


Berechnung und Zuweisung in einer Zeile.

Walrus soll verwendet werden, wenn man vermeiden möchte das eine Berechnung zweimal ausgeführt wird.

Beispiel Klassisch `n+1` wird zweimal berechnet:

In [12]:
n = 4
if (n + 1) > 3:
    print(n+1)

5


Mit Walrus lässt sich im `if` die Berechnung `n+1` der Variablen `out` zuweisen:

In [14]:
n = 4
if (out := n + 1) > 3:
    print(out)

5


Ohne Walrus lässt sich dennoch immer vermeiden die Berechnung `n+1` zweimal auszuführen:

In [13]:
n = 4
out = n + 1
if out > 3:
    print(out)

5


**Persönliche Meinung**: Ich rate davon ab Walrus `:=` zu verwenden. In meinen Augen macht es den Code Grundsätzlich unlesbar und spart im besten Fall 2-3 Zeilen Code. In meiner eigenen Programmiererfahrung gab es nie einen Grund den Operator zu verwenden, er fügte nie einen realen Nutzen in irgendeine meiner Berechnungen ein. Dennoch wollt ich dir einmal Demonstrieren wie Walrus funktioniert.